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Заключение 


ВВЕДЕНИЕ 


Можно было бы назвать эту книгу «Искусственный интеллект = 
представление знаний + методы поиска решений». Аллюзия с книгой 
Никлауса Вирта «Алгоритмы + структуры данных = программы» [1] 
намеренная. Мы искренне, в силу воспитания, накопленного опыта и 
врожденных предпочтений, придерживаемся идеологии пионеров и 
основоположников, подобных Вирту и другим, часто и много их 
цитируем и пересказываем. 

Отбор материала для пособия вполне традиционный, можно 
сказать классический, но способ изложения сугубо авторский. Во- 
первых, на первое место мы ставим прикладные аспекты, то есть 
решение полезных задач на компьютере методами искусственного 
интеллекта, а в ответ на вопрос «может ли машина мыслить?» 
отшучиваемся. Теория без практики кажется нам скучной 
схоластикой, и мы ее избегаем. Во-вторых, мы считаем, что 
исследование способов представления «человеческих» знаний в 
компьютере намного существеннее в настоящее время, чем 
совершенствование «машинных» алгоритмов поиска решений, 
которым отдавался приоритет в предшествующие полвека. Именно 
поэтому представлению знаний у нас уделяется наибольшее 
внимание. В-третьих, мы предпочитаем объяснения на примерах и с 
помощью коротких программ, в противовес излишне 
распространенному в этой области наукообразию. Мы считаем, что 
предъявление текста программы, решающей задачу, часто бывает 
более убедительно, чем введение нумерованных определений и 
доказательство «математических» теорем. 

Материал книги сконцентрирован вокруг ответа на вопрос: как 
знания и умения человека выразить в виде программы для 
компьютера? Прежде чем отвечать на этот технический вопрос, 
уместно дать ответ на вопрос идеологический: зачем? Зачем 
представлять знания в компьютере? Наш ответ прост: в последнее 


время это стало экономически выгодно. Кроме того, это довольно 
трудно, а потому просто чрезвычайно интересно. 

Современные тенденции в области применения компьютеров 
характеризуются возрастанием значения методов искусственного 
интеллекта (ИИ) в программном обеспечении. Можно сказать, в 
настоящее время происходит непрерывный процесс 
«интеллектуализации компьютеров»'. Мы имеем в виду следующую 
несомненную тенденцию: на заре своего развития компьютеры были 
«большими арифмометрами», а сейчас корень сотрше в слове 
компьютер является уже анахронизмом. Современный компьютер — 
это информационная машина, которая обрабатывает знания, 
представленные в виде данных. Эта тенденция иллюстрируется 
гистограммой на Ошибка! Источник ссылки не найден., На которой мы показали 
соотношения между вычислительными ресурсами, используемыми 
для инженерных расчетов и для обработки знаний сейчас и полвека 
тому назад. Инженерные расчеты — это собирательное название для 
таких приложений, как расчеты полеты ракеты, начисление зарплаты, 
и т.д., а обработка знаний — это информационный поиск в Интернете, 
телекоммуникации и т.д.’ Заметим, что численные значения 
процентов и масштаб на этом рисунке довольно условны. 
Действительно, за полвека суммарная вычислительная мощность, 
доступная человечеству, выросла более чем в 10! раз, а не в четыре 
раза, как на рисунке. Темпы роста вычислительных ресурсов не 
укладываются в голове, ни с чем подобным человечество ранее не 


' Этот процесс идет не только снаружи, в области программного 
обеспечения, но и изнутри. Компьютеры становятся все мощнее, и методы 
ИИ, которые еще вчера представляли только академический интерес, 
поскольку были нереализуемы «в железе», сегодня уже используются в 
промышленности. 


2 Самым распространенным способом использования компьютеров 
является простой в выключенном состоянии, а вторым по частоте 
применения является игра в компьютерные игры. Эта два применения 
компьютеров мы оставляем за рамками данного рассмотрения. 


сталкивалось. Всё большая доля этой стремительно растущей мощи 
тратится именно на обработку знаний! 


Годы 4 


Инженерные расчеты Обработка знаний 


2К 


1950 


90% 10% Ресурсы ВТ 


Рис. 0.1. Перераспределение вычислительных ресурсов со временем 


Направление искусственного интеллекта в информатике с 
самого начала вызвало большой, можно даже сказать, нездоровый 
интерес. Недобросовестные журналисты, падкие на сенсации, 
гиперболизировали робкие ростки новых идей, внушая 
необоснованно высокие ожидания широкой публике, и когда первые 
теоретические результаты не оправдывали завышенных ожиданий, те 
же журналисты участвовали в освистывании идей искусственного 
интеллекта. Но в ХХІ веке ситуация изменилась. За последнее время 
результаты, полученные в этом направлении, переросли рамки 
академических экспериментальных разработок и начали применяться 
в практических приложениях. Системы искусственного интеллекта с 
пользой применяются в реальной жизни, от медицинской диагностики 
до управления космическими аппаратами; к этому можно относиться 
как угодно, но это невозможно отрицать. Именно поэтому курсы 
«Методы обработки знаний», «Прикладной искусственный 
интеллект» и т. п. стали практически обязательными в учебных 
планах подготовки специалистов по информатике. 

Инженеры, подготовленные по специальности «прикладная 
математика», и специалисты по информатике, работающие в 
наукоемких прикладных областях, должны владеть основными, уже 
устоявшимися методами поиска решения переборных задач, 
разработанными в исследованиях по искусственному интеллекту. 


Необходимо подчеркнуть, что решающую роль в практической 
применимости методов решения переборных задач играют основные 
связанные с этими методами формализмы, используемые для 
предоставления знаний в компьютерах. Методы представления 
знаний, таким образом, являются ядром направления искусственного 
интеллекта. Именно это ядро, совершенно необходимое как 
начинающим студентам, так и опытным инженерам, является 
предметом книги. 

Мы ожидаем, что студенты, прослушавшие данный курс, 
достигнут следующих результатов. 

1.Знание основных методов поиска решения алгоритмически 
сложных задач; знание сравнительных достоинств и недостатков этих 
методов; знание основных принципов наиболее известных способов 
представления знаний: правил продукции, формул исчисления 
предикатов, семантических сетей. 

2. Умение выбрать подходящий способ представления знаний 
для конкретной задачи в простых случаях; умение оценить 
адекватность использования для конкретной задачи того или иного 
метода поиска решения. 

3. Свободное владение основными понятиями из области 
искусственного интеллекта и представления знаний; умение изучить 
по литературе другие методы искусственного интеллекта; умение 
оценить конкретную прикладную систему искусственного интеллекта 
и воспользоваться ею. 

Методы искусственного интеллекта сейчас очень быстро 
развиваются и меняются, и невозможно дать заранее готовые рецепты 
на все случаи применения ИИ. Вместо этого в книге дается общее 
представление об основных принципах искусственного интеллекта, 
определяются наиболее распространенные методы представления 
знаний в компьютере. 


ГЛАВА 1. ПРИКЛАДНЫЕ СИСТЕМЫ 
ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 


Проблемой человеческого интеллекта исследователи 
занимаются очень давно, хотя попытки структурировать это явление 
психики, или хотя бы приблизиться к более-менее строгим 
определениям явлений и процессов, реализующим человеческий 
интеллект, не всегда результативны. Авторы не являются 
специалистами ни в физиологии мозга, ни в психологии, равно как и 
не собираются «играть» на поле классической философии. Тем не 
менее (или, скорее, «в обоснование позиции»), мы позволим себе 
некоторые отступления и цитаты, иллюстрирующие ситуацию в 
упомянутых областях. 

На сегодняшний день в психологии принято считать, что 
существует некий общий интеллект как универсальная психическая 
способность познания, в основе которой может лежать генетически 
обусловленное свойство нервной системы перерабатывать 
информацию с определенной прагматикой, скоростью и точностью. 
Считается, что многие виды умственной деятельности человека, 
например программирование, занятие математикой, проведение 
лекций, или чтение книг, подобных этой, требуют интеллекта. 

К сожалению, до сих пор понимание того, что каждый из нас 
носит в черепной коробке, по большому счету, вряд ли можно считать 
достаточно полным. Если говорить о структуре мозга, как носителе 
интеллекта, то известно, что образующими элементами выступают 
клетки особого вида — нейроны. Доказано, что, по крайней мере одна 
из форм взаимодействия нейронов реализуется электрохимическим 
путем, но вопрос, является ли эта форма единственной, остается 
открытым. Современная ситуация напоминает гипотетическую 
попытку кроманьонца понять, как устроен персональный компьютер, 


и что он может делать. Впрочем, что там говорить о мозге, если мы до 


сих пор не в состоянии полностью осмыслить механики процесса 
хождения на двух конечностях. 

Мы видим, что понятие «интеллект» для человека определяется 
косвенно, через предметную область, по некоторым результатам 
деятельности, а не напрямую указывается, что собой представляет и 
как реализуется этот аспект психики. Существующие определения, 
которые можно найти в энциклопедических изданиях, как правило, 
дают толкование, используя синонимичность и рекурсию. Например, 
энциклопедический словарь дает следующее краткое определение. 

Интеллект (от лат. іпіеПесіиѕ — познание, понимание, 
рассудок) — способность мышления, рационального познания. 

Толковый психологический словарь близок, но отличается 
большей детализацией в определении. 

Интеллект (от лат. іпіеПесіиѕ — понимание, познание) — 
способность к осуществлению процесса познания и к эффективному 
решению задач, в частности при овладении новым кругом жизненных 
проблем. 

Другими словами, определения ничего не определяют, но могут 
иногда стимулировать верные ассоциации, само же понятие 
«интеллект» является весьма расплывчатым и недостаточно 
адекватным. Невозможно, в частности, понять сущности интуиции, 
механизма веры, природы других иррациональных отношении 
(любви, антипатии) и так далее. 

Само слово «интеллект» пробралось в термин «искусственный 
интеллект» не совсем законно. Дело в том, что исходный 
оригинальный термин агіћсіа1 п\еШеепсе (см. параграф 0) имеет 
значительно более мягкий смысл. Слово іпіеШеепсе все-таки скорее 
означает сообразительность, нежели рефлектирующий разум, как 
фундаментальное свойство человека. Но другой перевод на русский 
язык предложить трудно и уже поздно, поэтому мы пользуемся 
существующим переводом, вкладывая в него следующий смысл. 


Предметом этой книги является прикладной искусственный 
интеллект (ИИ), и здесь мы рассуждаем о практически реализуемых 
и полезных проектах, избегая пикировки в стиле пресловутого 
«голого петуха» Платона-Диогена?. Понятие ИИ созвучно понятию 
интеллекта естественного, но имеет с последним, на самом деле, мало 
общего. Важно уяснить, что ИИ не является моделью человеческого 
мышления", так же как, например, резина не является химической 
моделью каучука, хотя обладает рядом схожих физических свойств. 
Действительно, программа с искусственным интеллектом использует 
некоторые алгоритмы, свойственные так же и человеческому 
мышлению (в конце концов, любая программа написана людьми). Но 
в реальной жизни человек будет решать ту же задачу иначе, чем это 
делает программа (производя другие операции, используя другие 
алгоритмы, задействуя структуры психики, пока что недостаточно 
изученные, а потому не поддающиеся переводу в математические 
формулы и программный код). Лобовой подход — изложение 
«человеческих» алгоритмов «машинным» языком малоэффективен, 
как мы увидим в дальнейшем. Другими словами, если мы относим 
задачу к интеллектуальным, то любое ее решение, по нашему 
определению, свидетельствует о некотором интеллекте. Если 
решение добывается программным путем, то эта программа 
содержит элементы интеллекта. 


° Когда Платон дал определение, имевшее большой успех: «Человек 
есть животное о двух ногах, лишенное перьев», Диоген ощипал петуха и 
принес к Платону в школу, объявив: «Вот платоновский человек!». После 
этого к определению было добавлено: «И с широкими ногтями». 


* Ведутся исследования, направленные на моделирование мышления 
человека в компьютере, именно с целью изучения мышления человека, а 
не с целью решения интеллектуальных задач на компьютере. В данной 
книге мы рассматриваем не моделирование мышления, а решение 
прикладных задач, что подчеркивается использованием прилагательного 
«прикладной» применительно к ИИ. 
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Программа, умеющая решать задачи в предметной области, 
которую традиция относит к интеллектуальным, называется 
прикладной системой с элементами” искусственного интеллекта. 

Другое определение: прикладная система с элементами 
ИИ — это программа, алгоритм которой (пока!) нельзя найти в 
вузовском учебнике. Например, на заре программирования 
программы, которые могли строить другие программы (первые 
компиляторы), считались «интеллектуальными». Современные 
компиляторы не считаются интеллектуальными программами, хотя 
«знают» про составление программ значительно больше и применяют 
весьма изощренные алгоритмы решения задач компиляции и 
оптимизации. Можно приводить и другие примеры. В каждом 
отдельном случае конкретная прикладная система ИИ — это ноу-хау 
создателей такого программного обеспечения, но каждый раз любая 
новая идея в конкретной предметной области дает существенное 
продвижение в развитии искусственно-интеллектуальных систем в 
целом. При этом по мере их прогресса меняются и традиции 
отнесения предметных областей к интеллектуальной сфере, и 
меняется оценка степени «интеллектуальности» многих задач. 
Например, расчет конструкции Эйфелевой башни в конце ХІХ века 
потребовал огромного труда, недюжинного интеллекта и 
изобретательности, а сейчас подобный расчет может быть выполнен 
рядовым инженером-конструктором с помощью готового пакета 
программ быстро, надежно и без особых умственных усилий. Опыт и 


интеллект инженеров-конструкторов, исчерпывающие знания по 


° Мы вставили в наше определение осторожное слово «элементы», 
чтобы подчеркнуть, что программа решает некоторые задачи в 
определенной области и не претендует на универсальную «способность 
мышления, рационального познания». Менее осторожные или более 
самонадеянные авторы употребляют оборот «прикладные системы с 
искусственным интеллектом». Мы также употребляем этот оборот, 
например, в названии первой главы, но оговариваем, что понимаем его в 
осторожном и минимальном смысле. 


механике, сопротивлению материалов и другим инженерным 
дисциплинам в значительной степени аккумулированы в 
современных конструкторских пакетах. Такой пакет, вне всякого 
сомнения, демонстрирует интеллектуальное поведение, однако мы не 
считаем его прикладной системой ИИ, поскольку все расчеты в 
конструкторском пакете выполняются по хорошо известным, заранее 
заданным однозначным алгоритмам. 

Для подкрепления изложенных тезисов и конкретизации 
основного определения прикладной системы с элементами ИИ 
рассмотрим некоторые из предметных областей, типичных для 


приложений искусственного интеллекта. 


1.1. ОБЗОР ПРИЛОЖЕНИЙ ИИ 


Некоторыми типичными приложениями, использующие 
элементы ИИ, являются: 

- понимание естественного языка и машинный перевод; 

- интеллектуальные базы данных и вопрос-ответные системы; 

- экспертные системы и автоматическое доказательство теорем; 

- планирование действий робота и распознавание образов; 

- интеллектуальные игры. 

Этот список не является ни исчерпывающим, ни 


ортогональным. Это просто набор наших излюбленных примеров. 
1.1.1. Понимание естественного языка и машинный перевод 


Процесс понимания естественного языка — это процесс 
передачи знаний от одного носителя языка к другому. 

Несмотря на всю свою кажущуюся простоту и привычность, 
этот процесс чрезвычайно сложен. Он подразумевает наличие общей 
области знаний у обоих партнеров и согласованных механизмов 
представления знаний в виде данных, а также наличие обратного 
механизма извлечения знаний из данных. 

Для компьютерной реализации процесса понимания 
естественного языка требуются мощные вычислительные ресурсы, 


управляемые нетривиальными (интеллектуальными) программными 
комплексами. Рассмотрим, в чем здесь состоит проблема. Пусть у нас 
есть два интеллектуальных агента, для начала пусть это будут люди. 
Первый является источником знаний, назовем его А, а второй — 
приемником знаний, назовем его В. В процессе понимания 
задействовано два механизма. Во-первых, у А есть алгоритм, 
позволяющий преобразовывать гипотетические знания в данные, 
сигнал, (текст, речь или другие формы выражения естественного 
языка) — механизм представления знаний. Во-вторых, у В есть 
механизм, который позволяет преобразовывать получаемый сигнал 
обратно в знания — механизм извлечения (знаний). Если принять, что 
эти механизмы реализуются алгоритмами’, то понятно, что у каждого 
из них есть область определения и область значений, вход и выход. 
Понимание происходит тогда, когда выход алгоритма представления 
знания и вход алгоритма извлечения знаний, по меньшей мере, 
пересекаются на общей интерпретации; а полное понимание 
достигается тогда, когда эти области совпадают. 

Приведем несколько примеров. Пусть мы, автор — это агент А, 
а вы, уважаемый читатель, это агент В. Следующая фраза: «овелан 
аварпс ее иласипаз отсорп ым» — вызовет у вас, скорее всего, 
недоумение и непонимание в первое мгновение. Здесь агент А 
использует нестандартный способ представления знаний, и это 
создает затруднения при извлечении знаний агентом В. Еще пример. 
Если А использует язык, которым В не владеет (скажем, если бы текст 
этого абзаца прочел бы по-китайски для вас вслух китаец, знающий 
русский, при условии, что вы не знаете китайского), то происходит 
следующее: механизм представления знаний работает, механизм 
извлечения работает, но должного понимания не происходит. 


6 Язык жестов — это также естественный язык. 
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Например, дар «говорить языками», который апостолы получили в 
день Пятидесятницы после сошествия на них Святого Духа (Деян. 2:3-11), 
явно неалгоритмической природы. 


Русскоговорящий агент В смог бы оценить, к примеру, музыкальность 
речи, необычность звукосочетаний... и, в конце концов, прийти к 
выводу, что он, агент В, ничего (!) не понял, т.е. имеет место пустая 
общая интерпретация. А вот пример «ортогональной“» общей 
интерпретации. Русская девушка спрашивает своего парня 
(болгарина): Ты меня любишь? — Тот в ответ качает головой (от плеча 
к плечу). – Девушка рыдает от горя, хотя должна бы прыгать от 
счастья! — Дело в том, что у болгар наш подтверждающий кивок 
является жестом отрицания, а покачивание головой из стороны в 
сторону -— означает подтверждение. 

Мудрецу достаточно сказать одно слово, для того, чтобы другой 
мудрец его понял. Иными словами, для мудрецов общий объем 
передаваемых данных может быть значительно меньше, чем у 
среднестатистических людей, за счет более мощных механизмов 
представления и извлечения знаний. 

Общая интерпретация — это одинаково трактуемый обеими 
сторонами набор семантических правил, связывающих языковые 
конструкции с их смысловой нагрузкой. 

Обратимся теперь к компьютерам. В компьютерах механизмы 
представления знаний и извлечение знаний тривиальны, понимание 
сводится к передаче данных. Поэтому, если компьютеры соединены 
каналом связи и форматы данных согласованы, то понимание 
достигается легко, а в противном случае, понимания нельзя достичь 
никоим образом. Критическим случаем, находящимся в фокусе 
нашего внимания, является взаимопонимание человека и компьютера. 
Существует два принципиально разных способа общения человека с 
компьютером (Ошибка! Источник ссылки не найден..1). Первый из 
них — когда человек способен понимать компьютер. Это не заслуга 
компьютера, а способность человека, которого все окружающие 
называют программистом. Второй — когда компьютер способен 


8 т 
Пересечение не пусто, но смысл конструкций прямо 


противоположен. 
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понимать человека. Такой компьютер обязательно должен обладать 
элементами ИИ. Поскольку в аппаратном обеспечении обычного 
компьютера трудно разместить интеллект, даже искусственный, ясно, 
что понимание должно обеспечиваться программно. И такие 
программы были созданы уже сравнительно давно, хотя все они без 
исключения весьма и весьма ограничены в понимании естественного 
языка или даже какого-либо более-менее широкого фрагмента языка. 
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Рис. Ошибка! Текст указанного стиля в документе отсутствует..1. 
Общий контекст понимания 


Одной из первых прикладных систем ИИ, понимающих 
естественный язык, явилась программа ЕШУА, созданная в 1966 году 
Дж. Вейценбаумом. 

Позднее Терри Виноград (Теггу Міпортайа) написал книгу 
«Программа, понимающая естественный язык», описывающую 
программу ЕЛА [2]. Структура программы ЕШУА была 
чрезвычайно проста и включала в себя всего несколько десятков 
эвристических правил, предназначенных для распознавания 
грамматических конструкций (путем простого сравнения с образцом) 
и преобразования поступающих вопросов в «естественные» ответы. В 


результате эта программа могла вести вполне правдоподобный 
диалог, зачастую, при этом, отвечая вопросом на вопрос. Пример 
диалога с программой ЕМИА: 

— ВИА, ты компьютерная программа. 

— Почему Вы думаете, что я компьютерная программа? 

— Потому что тебя составил Вейценбаум. 

— Расскажите мне о Вейценбауме. 

Несмотря на всю свою простоту, эта программа находит 
применение в психотерапии. Разговор психотерапевта с пациентом 
может продолжаться довольно длительное время, прежде чем 
достигается терапевтический эффект. ЕМУА успешно имитировала 
диалог с роджерианским психологом в течении многих часов (суть 
этого метода заключается в том, что терапевт выслушивает пациента 
и задает наводящие вопросы, в результате чего психическое 
состояние последнего улучшается... или не улучшается). Многие 
пациенты отмечали, что эти сеансы оказались крайне полезны для 
них, и отказывались верить, что с ними разговаривала компьютерная 
программы, а не профессиональный психолог-человек. 

Сам Вейценбаум, шокированный поведением своего детища, 
вскоре пришел к выводу, что «основная идеология развития 
искусственного интеллекта — искусственный разум — 
безнравственна». Джозеф Вейценбаум (Јоѕерһ У\У№е1тепбаит), 1923— 
2008 — известный деятель в области искусственного интеллекта, 
заслуженный профессор МТИ (Массачусетский технологический 
институт). Основатель организации «Компьютерные профессионалы 
за социальную ответственность». За свои взгляды на ответственность 
ученых-программистов перед человечеством снискал в среде 
специалистов по информатике репутацию диссидента и еретика. 
«Существуют задачи, выполнение которых не следует поручать 
вычислительным машинам, независимо от того, можно ли добиться, 
чтобы вычислительные машины их решали». 


Машинный перевод является частным уточнением проблемы 
понимания естественного языка. «Частность» определяется, главным 
образом, режимом обмена информацией — монолог вместо диалога. 

Системы автоматического перевода текстов с одного 
естественного языка на другой образуют важный класс программных 
комплексов с элементами искусственного интеллекта. 

Перевод с одного естественного языка на другой, несомненно, 
является интеллектуальной задачей. Автоматический машинный 
перевод привлек внимание исследователей едва ли не раньше других 
предметных областей, ввиду явной практической востребованности 
этой задачи. 

Важно, что, как и в других случаях ИИ, в классе систем 
машинного перевода выделяется целый ряд категорий все 
возрастающей сложности: 

- электронный словарь; 

- подстрочник технических текстов; 

- художественный перевод поэзии; 

- синхронный перевод речи. 

Ясно, что эти задачи не могут быть решены единообразно, а 
значит, их решения появляются в разное время и опираются на 
различные технологии. 

Для каждой новой области применения ИИ наблюдается одна и 
та же характерная картина (Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..2), которую мы проиллюстрируем на примере 
истории развития машинного перевода. После появления новой идеи 
к ней проявляется повышенный интерес, возникают завышенные 
ожидания, пользователи ждут чуда. Но чуда не происходит — методы 
ИИ трудоемки, сложны, и их развитие требует немалого 
естественного интеллекта. Наступает разочарование, новое 
направление уходит из сферы ажиотажного интереса и иногда 
подвергается даже необоснованной обструкции. Если идея была 
плодотворна, то, несмотря на падения интереса в средствах массовой 


информации, подспудная кропотливая работа в академических кругах 
продолжается, и через некоторое время (не сразу!) начинает давать 
практические результаты. Интерес вновь появляется, но уже не 


праздный, а деловой и обоснованный. 
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Рис. Ошибка! Текст указанного стиля в документе отсутствует..2. 
История популярности машинного перевода 


В марте 1947г. Уоррен Уивер (\Уатеп Меауег), 1894-1978, 
директор отделения естественных наук Рокфеллеровского фонда, в 
переписке с Эдрю Бутом (Апаге\х О. Воой) и Норбертом Винером 
впервые сформулировал концепцию машинного перевода, которую 
несколько позже (в 1949 г.) развил в своем меморандуме, 
адресованном Фонду. 

В 1952г. состоялась первая конференция по машинному 
переводу в Массачусетском технологическом институте, а в 1954 гв 
Нью-Йорке была представлена первая система машинного 
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перевода — ІВМ МагК П, разработанная компанией ІВМ совместно с 
Джоржтаунским университетом (это событие вошло в историю как 
«Джорджтаунский эксперимент»). Была представлена очень 
ограниченная в своих возможностях программа (она имела словарь в 
250 единиц и 6 грамматических правил), осуществлявшая перевод с 
русского языка на английский. После этого подобные разработки 
получили широкое распространение в Италии, Франции, Англии, 
Японии, а также был создан международный специализированный 
журнал. 

В 1959 г. философ Й. Бар-Хиллел (Үоһоѕһџа Ваг-НШе!) 
выступил с утверждением, что высококачественный полностью 
автоматический машинный перевод не может быть достигнут в 
принципе. Это выступление самым неблагоприятным образом 
отразилось на развитии машинного перевода в США. В 1966 был 
отмечен мощный спад, связанный с отчетом специально созданной 
Национальной Академией наук США комиссией АГРАС (Аџотабйс 
Гапоџаве Ргосеѕѕпо АЯуіѕогу Соттіќее). Комиссия пришла к 
заключению, что машинный перевод нерентабелен: соотношение 
стоимости и качества машинного перевода было явно не в пользу 
последнего, а для нужд перевода технических и научных текстов 
было достаточно человеческих ресурсов. Поэтому Министерство 
обороны решило прекратить финансирование такого рода проектов. 
Тема перестала быть модной, и работу продолжили только 
квалифицированные энтузиасты и профессионалы. 

С развитием вычислительной техники в конце 70-х годов 
(появление микрокомпьютеров, развитие сетей, увеличение ресурсов 
памяти) машинный перевод вошел в эпоху «Ренессанса». При этом 
несколько сместились акценты: исследователи теперь ставили целью 
развитие «реалистических» систем машинного перевода, 
предполагавших участие человека на различных стадиях процесса 
перевода. В результате в 80-х годах на рынке появились первые 
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промышленные системы машинного перевода, ориентированные на 
массовое использование. 

В 1990 г., когда системы машинного перевода снова стали 
одним из приоритетных направлений развития компьютерной отрасли 
и вышли на новый качественный уровень, пройдя непростой этап 
переосмысления и взаимной интеграции, Ларри Чайлдс (Гаггу СВ $) 
предложил их классификацию. Он разделил все «электронные 
переводчики» на три группы: 

1. РАМТ (Ешу-аџѓотаѓеа тасһіпе (гапѕјайоп) — инструменты 
полностью автоматизированного машинного перевода. 

входной текст — анализ / синтез текста > выходной текст 

2. НАМТ (Нотап-аѕѕіѕіеа тасһіпе ігапѕ1айоп) — приложения для 
автоматизированного машинного перевода текстов, выполняемого 
при участии человека. 

входной текст — редактор > анализ / синтез текста > 
редактор выходной текст 

3. МАНТ (Масіпе-А ѕ515їей Нитап Тгапѕіайоп) — 
вспомогательные средства для выполнения перевода человеком с 
использованием компьютера. 

входной текст — переводчик — подстрочник — редактор > 
выходной текст 

Но жизненная практика свидетельствует о том, что в 
функционировании всех существующих на сегодняшний день систем 
машинного перевода в большей или меньшей степени необходимо 
участие человека-редактора. 

Концептуально система машинного перевода имеет следующую 
структуру (Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..3, слева): текст на исходном языке сначала анализируется, 
т.е. производится интерпретация данных с целью «понимания 
смысла», а затем понятый смысл представляется в виде текста на 
целевом языке. В идеале анализ производится «до полного 
понимания», когда весь смысл исходного текста выражается на 
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некотором гипотетическом универсальном метаязыке. Традиционно 
этот универсальный метаязык называют іпіегіпоџа. Следует отметить, 
что к настоящему времени идеал так и не достигнут. Современные 
системы машинного перевода имеют трехслойную архитектуру (Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..3, справа). 
Сначала проводится анализ входного языка до достижения 
некоторого уровня понимания, и это понимание выражается в 
построении различных структур над исходным текстом, часто 
специфических для определенного языка. Затем, используя 
эвристически алгоритмы, производится преобразование частично 
понятых структур одного языка в частично понимаемые структуры 
другого языка. Набор этих алгоритмов традиционно называется 
переносом (от английского ігапѕѓег). Правила переноса имеют 
большой объем, используют огромные информационные ресурсы и 
весьма изощренные алгоритмы. Наконец, по перенесенным 
структурам целевого языка (они вовсе не обязательно изоморфны 
структурам исходного языка!) синтезируется текст на целевом языке. 
Разумеется, этап переноса является самым сложным, важным и 
наукоемким. 


Исходный Целевой Словарь: 
язык язык 
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Рис. Ошибка! Текст указанного стиля в документе отсутствует..3 


Структура системы машинного перевода 
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Впрочем, мечты, с которыми род людской взялся полвека назад 
за задачу машинного перевода, в значительной мере остаются 
мечтами —  высококачественный («художественный») перевод 
текстов широкой тематики по-прежнему недостижим. Однако 
несомненным является ускорение работы переводчика и повышение 
качества при использовании систем машинного перевода. 

По мере появления все новых и новых алгоритмов, методик и 
программных решений, нацеленных на компьютерный перевод 
текстовой информации, достоверными фактами является наличие у 
таких систем целого ряда преимуществ перед обычным 
«рукотворным» переводом: 

- высокая скорость перевода (использование машинного 
перевода позволяет значительно сократить время, требуемое для 
перевода больших объемов текста, по современным оценкам на 
50-70%); 

- снижение стоимости перевода (с помощью машинного 
перевода можно сэкономить на оплате услуг профессиональных 
переводчиков, и при переводе «простых» текстов отказаться от них 
вовсе); 

- конфиденциальность переводимой информации (участие 
компьютера в обработке конфиденциальных документов в гораздо 
большей степени гарантирует нераспространение их содержания, чем 
участие переводчика); 

- универсализацию процесса перевода (даже самый 
квалифицированный переводчик, как правило, специализируется в 
определенных областях знаний и тематических направлениях, тогда 
как системы МП достаточно универсальны, и их работа зависит 
только от проведения необходимых настроек — подключения 
нужных электронных словарей и т. п.). 

В настоящее время существует множество коммерческих 
проектов машинного перевода: Ѕуѕігап, ІВМ, Г&Н ([егпоџ & 
Наџѕр1е), Гапоџаве Епопеегіпо Согроганоп, Аг, Тгайоѕ, СаѓегрШаг 
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Со., ШпооМаге. В России большой вклад в развитие машинного 
перевода внесла группа под руководством проф. Р. Г. Пиотровского 
(Российский государственный педагогический университет им. 
Герцена, Санкт-Петербург). Сейчас заслуженное признание получил 
автоматический переводчик, разработанный компанией ПРОМТ 
(РКОргаттег’ѕ  Маспше  Тгапайоп), который удовлетворяет 
ожиданиям большинства пользователей. 


1.1.2. Интеллектуальные базы данных и вопрос-ответные 
системы 


На заре использования компьютеров форматы хранения данных 
и средства для манипулирования ими изобретались программистами 
индивидуально для каждого случая. Это неудобно и неэффективно, и 
вскоре были предложены унифицированные способы хранения 
данных (модели данных) и разработаны унифицированные системы 
доступа к данным (системы управления базами данных — СУБД). 
Рассматривая концепцию базы данных (БД) с самой общей точки 
зрения, можно отметить, что БД поддерживает три основных группы 
операций: занесение данных в базу, поиск данных в базе и извлечение 
данных из базы, причем извлекаются те данные, которые до этого 
были занесены”. Были предложены и используются несколько идей, к 
которым это ограничение неприменимо. Одной из них является идея 
интеллектуальной базы данных. 

Интеллектуальная базы данных (ГиеШвзепт Раіадаѕе) 
предоставляет эффективный способ хранения, поиска и извлечения 


° Большинство пользователей СУБД воспринимают последнее 


утверждение как нечто, само собой разумеющееся, как закон природы, 
наподобие законов сохранения в физике. Какую информацию поместили в 
компьютер, такую и получим обратно! Но информация — вовсе не 
вещество и не энергия! Утверждение Михаила Васильевича Ломоносова 
«...сколько чего у одного тела отнимется, столько присовокупится к 
другому ...» неприменимо к информации. Вы можете скачивать 
информацию из Интернета на свой компьютер сколько угодно, от этого в 
Интернете количество информации не уменьшится. 
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большего числа фактов, чем те, которые были изначально 
загружены в базу. 

Рассмотрим простой случай. Реляционная база данных (см. База 
данных, снабженная такими правилами, является интеллектуальной. 

Таблица 1): таблица, строки которой соответствуют объектам, а 
столбцы — каким-то атрибутам объектов. Все объекты однотипны, и 
различаются только значениями атрибутов. Такая вещь позволяет 
отвечать на вопросы фактографического характера. Например, можно 
спросить: «В каком подразделении работает Новиков?», и получить 
ответ: Кафедра «Прикладная математика». Но если добавить туда 
информацию, представленную не как таблица, а как правило, можно 
будет отвечать на вопросы, ответы на которые не содержатся в базе 
данных. Идея состоит в том, что кроме обычных реляционных таблиц 
в базе данных хранятся и некоторые правила, например, такое: 


ТЕ (х.Должность = “Заведующий” & 
(х.Подразделение = у.Подразделение) 
ҰҺеп х начальник у 


База данных, снабженная такими правилами, является 


интеллектуальной. 
Таблица 1. Таблица базы данных. 
ФИО Должность Подразделение 
Новиков Доцент Кафедра «Прикладная математика» 
Клавдиев Заведующий Кафедра «Прикладная математика» 
Действительно, если поставить вопрос «Кто начальник 


Новикова?», то несложный встроенный механизм логического вывода 
легко найдет ответ: «Клавдиев». Приведенный пример позволяет 
выяснить отношения на уровне начальник-подчиненный. В данном 
случае, очевидно, что Клавдиев является начальником не только 
Новикова, но и любого другого сотрудника кафедры «Прикладная 
математика». Таким образом, интеллектуальная база данных может в 
качестве ответа выдать факт, который в ней не хранится. Более того, 
такие базы позволяют отвечать на вопросы, требующие дедуктивного 
рассуждения, состоящего не из одного применения правила, а из 
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многих применений, так что извлекаемые факты могут быть не так 
очевидны и весьма далеки от первоначально введенных. 

Интеллектуальная база данных, которой можно задавать 
вопросы и получать ответы на (ограниченном) естественном языке, 
называется вопрос-ответной системой (диеѕйоп-апѕуетіпе ѕуѕіет). 

Первые вопрос-ответные системы появились еще в 60-х годах 
ХХ века. Вопросы и ответы в этих системах формулировались, 
разумеется, на весьма ограниченном подмножестве естественного 
языка, упрощенном как по словарю, так и по используемым 
грамматическим формам. Источник информации — то есть база 
данных, из которой извлекались ответы — был у каждой такой 
системы свой, локальный и настроенный на одну узкую предметную 
область. Полезность и область применения таких систем была 
невелика, хотя они и пользовались известной популярностью. 

В настоящее время идея вопрос-ответных систем получила 
мощное развитие в форме интеллектуальных поисковых систем в 
Интернете. Опираясь на глобальные информационные ресурсы всего 
человечества, и используя достаточно изощренные новые алгоритмы 
анализа и синтеза текстов на ограниченном естественном языке, такие 
поисковые системы оказались более чем полезными. Без 
преувеличения можно сказать, что эти системы сейчас жизненно 
необходимы всем и каждому. 


1.1.3. Экспертные системы и автоматическое доказательство 
теорем 


Методы интеллектуальных баз данных получили дальнейшее 
развитие при разработке автоматических консультирующих систем. 
Такие экспертные системы (Ехрегї Ѕуѕіетѕ) способны предоставить 
компетентный ответ пользователю на конкретный вопрос. Первые 
экспертные системы были созданы для применения, например, в 
медицине (диагностика заболеваний) и в геологии (оценка 
месторождений). 
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Одна из самых главных проблем в этой области заключается в 
том, как следует представлять и использовать знания экспертов, 
которые по своей сути являются в достаточной степени 
разнородными и противоречивыми данными. 

Экспертные системы — системы искусственного интеллекта, 
включающие в себя знания об определенной слабо структурированной 
и трудно формализуемой узкой предметной области, и способные 
предлагать и объяснять пользователю разумные решения. 

В настоящее время считается общепринятым, что структура 
экспертных систем состоит из пяти блоков (Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..4). Совокупность трех 
блоков — Правила, Модель ситуации и Вывод — по сути, является 
интеллектуальной базой данных. Модули, позволяющие извлекать 
знания и объяснять выводы, превращают интеллектуальную базу 
данных в экспертную систему. 


Извлечение 
А Объяснение 
знаний 
вывода 
Кпоміеаде А 
нахе Веазоптд 
ади Шоп 
Вывод 
|егепсе 
Эксперт Правила Модель они Пользователь 
(База знаний = БЗ) (База данных = БД) 
Кпомеаде Базе Оа{а Базе 


Рис. Ошибка! Текст указанного стиля в документе отсутствует..4. 
Архитектура экспертной системы 

Сейчас чаще всего база знаний для экспертной системы — это 
набор правил. Простейший случай, когда правила имеют 
детерминированный характер!" и позволяют из имеющихся фактов 


10 
Довольно часто встречается ситуация, когда правила имеют не 
детерминированный, а вероятностный характер: «если А, то В с 
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выводить новые факты, как в интеллектуальной базе данных. Такой 
вариант детально рассматривается во второй главе, где мы говорим о 
представлении знаний системами продукций. 

Блок объяснений вывода фактически представляет машинный 
вывод результата в человеко-читаемой форме, так что пользователь 
может проследить, какие шаги рассуждений применяла экспертная 
система при решении задачи. Тем самым доверие пользователя к 
ответу возрастает. 

Наиболее важным и сложным является блок извлечения знаний. 
Результат работы этого блока понятен — это пополнение и изменение 
базы знаний. А вот исходные данные могут быть различными. Не 
следует надеяться на то, что эксперт в предметной области просто так 
«из головы» сформулирует эффективные правила рассуждений, 
причем сразу в том формате, который требуется в системе. Это 
маловероятное чудо. Одним из наиболее надежных считается метод 
постепенного пополнения и изменения базы знаний, причем поводом 
к изменению является каждый случай, когда система не смогла 
решить задачу или решила ее неправильно. В таком случае эксперт 
анализирует с помощью блока объяснения ход машинных 
рассуждений, определяет, какое правило было неудачным или какого 
правила не хватает, и добавляет его в базу знаний посредством блока 
извлечения знаний. Можно сказать, что экспертная система, подобно 
человеку, учится на ошибках. 

В центре структуры экспертных систем находится блок вывода. 
В этом блоке правила применяются к фактам из модели ситуации, в 
результате получаются новые факты, к которым также применяются 
правила и так далее пока не будет достигнута цель, то есть требуемый 
факт. Этот процесс по существу является процессом поиска вывода в 
формальной теории. Действительно, исходные факты из модели 


вероятностью р». Большинство выводов, сделанных экспертной системой 
по вероятностным правилам, имеют вероятностный характер. На свой 
вопрос пользователь получает несколько различных ответов, каждому из 
которых приписана своя вероятность достоверности. 
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ситуации — это аксиомы. Мы применяем к ним правила, получаем 
новые факты, причем каждый новый факт получается из ранее 
полученных фактов. В конце концов, мы доходим (или не доходим) 
до целевого факта, то есть, говоря языком логических теорий, 
получаем заключение целевой теоремы. Таким образом, ядро всякой 
экспертной системы можно рассматривать как систему 
автоматического поиска вывода в некоторой формальной теории, то 
есть как доказательство теорем. 

Доказательство теорем безусловно предполагает затрату 
интеллектуальных усилий, требующих не только дедуктивных 
навыков, но и в значительной степени интуитивных догадок 
(например, какие леммы необходимы для той или иной теоремы). 
Другими словами, доказательство теорем подразумевает, в том числе, 
поиск уже доказанных теорем и решенных подзадач, которые могут 
оказаться полезны для достижения конечной цели. К настоящему 
времени разработано несколько программ с элементами ИИ, 
способных работать в этом направлении, то есть программ 
автоматического доказательства теорем (Аиютайс Тћеогет Ргоу1по). 

При первом взгляде на предмет мы сразу отмечаем 
обстоятельства, известные из курса математической логики. 

1. Язык исчисления предикатов первого порядка, обогащенный 
такими вещами, как равенство и внелогические предикаты и функции, 
является общепринятым средством для аксиоматизации в 
большинстве предметных областей (то есть практически любое 
утверждение может быть сформулировано как формула прикладного 
исчисления предикатов). 

2. Алгоритм Тарского перечисления правильно построенных 
формул позволяет генерировать гипотезы исчерпывающим образом 
(то есть все правильно построенные формулы могут быть 
перечислены). 

3. Метод резолюций является частично корректным (то есть для 
любой доказуемой формулы вывод может быть найден 


30 


автоматически, а для недоказуемой формулы алгоритм может не 
завершить свою работу). 

Возникает следующая идея, подкупающая своей 
незатейливостью и простотой. Запишем аксиомы предметной области 
на языке исчисления предикатов первого порядка. Запустим алгоритм 
типа алгоритма Тарского, который будет генерировать новые 
гипотезы одну за другой. Каждую гипотезу будем пытаться 
автоматически доказывать методом резолюций, и если получится, то 
компьютер сам будет добывать все новые и новые знания. Процесс 
можно запустить на 24 часа в сутки, 7 дней в неделю, 365 дней в коду, 
и не на одном компьютере, а на всех незанятых в данный момент. 
Кстати, сейчас в среднем 90% времени персональные компьютеры 
простаивают, и их суммарная неиспользуемая вычислительная 
мощность довольно велика, так что у человечества хватает 
неиспользуемых ресурсов. 

Таким образом, автоматическое доказательство теорем 
возможно, и его нетрудно запрограммировать но такой 
прямолинейный подход оказывается безнадежно неэффективным. 
Сложные, интересные теоремы при лобовом подходе автоматически 
доказать не удается, потому что пространство перебора столь велико, 
что даже самые быстродействующие компьютеры не в состоянии 
ничего сделать за разумное время. 

Однако существуют примеры, правду сказать, пока 
немногочисленные, когда в очень узком классе математических 
теорий, применяя очень специфические методы, удавалось 
автоматически находить и доказывать нетривиальные 
содержательные теоремы, которые были ранее неизвестны. Одному 
из таких примеров уже много-много лет [3]. Член-корреспондент РАН 
В.М. Матросов придумал удивительный способ перечисления и 
доказательства математических фактов в одной узкой области, 
относящейся к теории дифференциальных уравнений. Коллеги- 
программисты составили программу, которая генерировала гипотезы 
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и автоматически строила к ним доказательства. Таким образом были 
найдены и доказаны некоторые действительно новые, нетривиальные 
теоремы. При этом результаты (теоремы и доказательства) 
публиковались в престижном математическом журнале, как новые 
научные результаты в математике. Мировое сообщество пока не 
знает, как отнестись к этому факту, однако прецедент есть. 

Следует подчеркнуть, что автоматическое доказательство 
теорем является основным инструментом всех прикладных систем с 
элементами искусственного интеллекта, которые в той или иной 
степени используют формулы логических исчислении Оля 
представления знаний. Формулы исчисления предикатов 
используются практически всегда— это основной способ 
формальной записи любых утверждений, известный человечеству в 
настоящее время. Поэтому можно смело утверждать, что 
автоматическое доказательство теорем — это фундаментальная 
тема ИИ. В следующих главах показано, что все рассматриваемые 
нами методы ИИ, а возможно и все методы ИИ вообще, прямо или 
косвенно сводятся к автоматическому доказательству теорем. 


1.1.4. Автоматическое управление роботом и распознавание 
образов 


Робот (тоБої) — автоматическое или дистанционно 
управляемое устройство, которое частично или полностью 
заменяет человека при выполнении некоторых видов работ. 

Слово «робот» было придумано чешским писателем Карелом 
Чапеком и его братом Йозефом и впервые использовано в пьесе 
Чапека «Р.У.Р.» («Россумские универсальные роботы», 1920). 

Роботы чаще всего используются при выполнении работ в 
опасных для жизни условиях или при относительной недоступности 
объекта. Все наслышаны об успехах беспилотных луно- и 
марсоходов, военных роботов, обеспечивающих разведку и 
обезвреживание взрывоопасных предметов. Недавно (в 2009 году) в 
Японии прошла очередная международная выставка роботов, на 
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которой большинством моделей были представлены бытовые и 
медицинские роботы (Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..5). К примеру, вниманию публики был 
представлен «робот-пациент» для обучения дантистов, который 
способен реагировать на боль. Другой образец —  «робот- 
полицейский», способный запоминать лица людей, которых 
разыскивает полиция. При установлении личности робот немедленно 
предупреждает об этом по радиосвязи сотрудников охранной службы. 
Все большую популярность приобретают роботы, созданные для 
развлечения. На той же выставке был представлен «робот-партнерша 
по танцам». Это «женщина» в человеческий рост, которая при 
помощи специальных датчиков чутко улавливает, в какую сторону 
движется танцор, и перемещается в такт с ним. Она может исполнить 
и короткий сольный танец, плавно перемещаясь и двигая руками, 
головой и корпусом. Начинает казаться, что мечты о будущем 
роботов, описанные фантастами ХХ века, начинают сбываться. 


Рис. Ошибка! Текст указанного стиля в документе отсутствует..5. 
Примеры роботов: робот, играющий в пинг-понг, робот-танцор, робот- 
пациент 

На самом деле, управление роботом (тобо рІаппіпо) — задача 
чрезвычайно сложная. Казалось бы, нет ничего проще, чем 
передвигаться на двух ногах. Развитие любого человеческого 
существа начинается со способности видеть и ходить. При изучении 
временной шкалы (Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..6) появляется мысль, что эти навыки вроде бы и не 
требуют значительных интеллектуальных усилий. На первый взгляд 
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может показаться, что говорить, рассуждать и программировать 
значительно сложнее. Однако если взглянуть на развитие роботов и 
робототехники, можно легко убедиться в обратном. Роботы сначала 
научились программировать и рассуждать, потом говорить, затем 


ходить, и До сих пор не научились видеть как следует. 


возраст 0 7 3 14 22 


человек 


говорит рассуждает программирует 


год 


робот 


1947 |1953 


рассуждает 
программирует 


Рис. Ошибка! Текст указанного стиля в документе отсутствует..6. 


говорит 


Сравнение развития возможностей робота и человека 

Успешное хождение двуного робота — достаточно сложная 
задача даже для современного уровня развития науки и техники. Дело 
в том, что когда мы ходим, центр тяжести нашего тела почти никогда 
не находится над площадью опоры. С точки зрения механики, мы не 
ходим, а непрерывно падаем, но не совсем, а удачно подставляем ногу 
в нужное место и продолжаем движение. Лобовой подход в стиле ХІХ 
века — составить механическую модель с нужным количеством 
степеней свободы и на каждом шаге решать соответствующую 
систему дифференциальных уравнений, — не работает. Даже самый 
быстродействующий современный компьютер не успевает проводить 
нужные вычисления в реальном времени. Совершенно ясно, что мы, 
когда ходим, не решаем в уме систему уравнений. Также и для 
реализации хождения роботов применяются совсем другие приемы. 
Каждое новое достижение в этой области рассматривается как 
значительный успех, что видно из перечисленного выше состава 
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экспонатов международной выставки. Что касается быстрого бега и 
прыжков (на уровне профессиональных спортсменов), то двуногий 
быстро бегающий и прыгающий робот — все еще почти нереальная 
задача на сегодняшний день '. Робот-терминатор, который может 
двигаться и стрелять так же ловко, как это делает Шварценеггер в 
известном фильме, пока что, к счастью, невозможен. 

До сих пор не создано адекватного аппарата, позволяющего 
роботу «видеть» окружающий мир и реагировать на «визуальные» 
изменения в нем также хорошо, как это делает человек. То, как видим 
мир мы, — результат длительного обучения, основанного на 
интеллектуальной активности. Известно, что уже на третьей неделе 
развития ребенок обладает цветным стереоскопическим зрением. В 
результате взаимодействия с предметами и накопления опыта 
наблюдений у ребенка на основе цветного стереоскопического зрения 
формируется новая способность — предметное восприятие. Важно 
подчеркнуть, что эта способность объясняется не физиологическими, 
а интеллектуальными причинами”. С другой стороны, исследователи 
установили, что если поместить человека в совершенно непривычную 
искусственную среду (в которой ненормально устроено освещение, 
привычные предметы имеют непривычные размеры, процессы имеют 
ненормальный темп и т.д.), то способность к адекватному восприятию 
трехмерной действительности человеком утрачивается. Таким 
образом, предметное восприятие — это способность психики, а не 
глаза. На самом деле, мы видим модель, которую очень быстро, за 
десятые доли секунды, строит мозг по информации, полученной из 
глаза. Иногда эта модель может несколько расходиться с реальностью 
(см. например Рис. Ошибка! Текст указанного стиля в документе 


И 
Впрочем, далеко не все представители человечества могут бегать и 
прыгать на уровне профессиональных спортсменов. 


? Способность видеть мир объемным объясняется не только тем, что 
у нас два глава. В этом нетрудно убедиться: прикройте один глаз — 
способность видеть не плоский, а трехмерный мир, и определять 
расстояния до предметов сохранится! 
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отсутствует..7 И Ошибка! Источник ссылки не найден. ВОшибка! Источник ссылки не 
найден. Параграфе 0). Проблема технического зрения заключается не в 
разрешающей способности камер и не в их количестве, а в сложности 
алгоритмов, адекватно восстанавливающих трехмерную модель по 
совокупности плоских изображений, полученных от камер. Для 
конкретных условий и специальных задач есть неплохие технические 
решения, например, роботы, распознающие человеческие лица в 
охранных системах, или роботы, распознающие положение и 
ориентацию мелких деталей на конвейере часового производства, 
однако эти системы не взаимозаменяемы и не совместимы. 
Универсальной системы технического зрения, сопоставимой по 
широте возможностей с человеческими, пока еще не 
сконструировано". 

Машинное зрение — это один из примеров широкой области 
применения методов ИИ, которая называется распознавание образов. 

Распознавание образов (райет  тесоотпоп)— раздел 
кибернетики, развивающий методы классификации и идентификации 
предметов, процессов и сигналов, которые характеризуются 
конечным набором свойств и признаков. 

К этой области относится, например, задача о переходе улицы 
по сигналам светофора. Распознавание цвета загоревшейся лампы 
светофора и знание правил дорожного движения позволяет принять 
правильное решение о том, можно или нельзя переходить улицу в 
данный момент. 

Одной из первых искусственных нейронных сетей, способных к 
восприятию (перцепции) и формированию реакции на воспринятый 
стимул был иерсептрон Фрэнка Розенблатта. Персептрон 
рассматривался его автором не как конкретное техническое 


Заметим, что еще Конан Дойль в рассказах о Шерлоке Холмсе 
справедливо акцентировал внимание на том, что способности замечать и 
распознавать детали (наблюдательность) у людей сильно варьируются. 
Часто бывает, что люди смотрят на одно и то же, а видят совсем разные 
вещи. 
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вычислительное устройство, а как модель работы мозга. Нужно 
заметить, что после нескольких десятилетий исследований 
современные работы по искусственным нейронным сетям редко 
преследуют такую цель. 

На примере распознавания образов мы опять наблюдаем 
характерную кривую развития направления ИИ (см. Рис. Ошибка! 
Текст указанного стиля в документе отсутствует..2 и пояснения к нему). 
После появления пионерской работы Розенблатта наблюдался резкий 
подъем интереса к этой тематике, затем последовал холодный душ в 
виде книги М. Минского и С. Пейперта, в которой, среди прочего, 
показана принципиальная ограниченность возможностей персептрона 
Розенблатта. Казалось, перспективы утрачены, но сейчас вновь 
наблюдается увеличение интереса к этой теме. К настоящему времени 
первоначальная идея трансформировалась в нейронные сети и 
нейрокомпьютеры, которые в текущий момент более чем успешны. 

Один из серьезных успехов в распознавании образов связан с 
созданием в 1982 г фирмой Г.оглса системы распознавания отпечатков 
пальцев, которая нашла широкое применение не только в 
криминалистике, но и в разнообразных системах защиты, например в 
ноутбуках. Другими примерами применения искусственно- 
интеллектуальных систем являются: распознавание речи, 
распознавание сканированного текста (ОСК), распознавание 
автомобильных номеров или мониторинг среды по аэрофотоснимкам. 

Необходимо хорошо понимать, что синтез информационного 
объекта всегда значительно проще, чем анализ того же самого 
объекта. Наглядный пример — рукописный текст. Его очень легко 
написать, но прочитать его иногда неимоверно трудно. Всем нам, 
надо полагать, знакома ситуация, когда в Интернете при регистрации 
на сайте, отправке сообщения и тому подобных операциях 
необходимо «расшифровать» код на рисунке. Это считается 
достаточно надежным тестом, отличающим реального пользователя 
от робота. Современные программы распознавания не могут 
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проанализировать сложное изображение, где контуры букв и цифр не 
замкнуты, линии причудливо искажены и присутствует большое 
количество «шума», а человеку это удается практически без усилий. 
Пока что распознавание образов — неоспоримое конкурентное 
преимущество человека по отношению к роботу — надолго ли? 

Мы закончим этот раздел примерами изображений (Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..7), которые 
показывают, что задача распознавания образов отнюдь не проста, 
даже для человека. 


Голова осла или обнаженные фигуры? 


Одно лицо или два? Молодая женщина или старуха? 
Рис. Ошибка! Текст указанного стиля в документе отсутствует..7. 
Примеры сложных изображений для распознавания образов 


1.1.5. Интеллектуальные игры 


Одно из самых известных и популярных применений 
прикладных систем с элементами искусственного интеллекта — это 
разнообразные интеллектуальные игры (п\еШеепЕ ратеѕ). Почти 
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наверняка каждый сталкивался с искусственным интеллектом, 
использующимся именно в этой области. Шашки, шахматы, нарды 
встречаются и в мобильном телефоне, и в качестве более серьезных 
программ для достаточно мощных компьютеров. 

Исторически случилось так, что из всех интеллектуальных игр 
внимание программистов-исследователей более всего привлекали 
шахматы. На данный момент лучшие компьютерные шахматные 
программы уже превосходят в игре известных гроссмейстеров мира. 
Можно сказать, что в шахматы компьютер переиграл человека. При 
этом следует подчеркнуть, что никаких чудес в шахматных 
программах нет. В них используются хорошо известные и тщательно 
реализованные алгоритмы, подобные тем, что рассматриваются в 
главе 3. Тем не менее, если мы принимаем утверждение, что игра в 
шахматы на гроссмейстерском уровне требует интеллекта, то мы 
вынуждены признать, что лучшие шахматные программы обладают 
интеллектом. При этом компьютерные шахматы — это не только 
развлечение, но и способ обучения новых шахматистов, создание 
шахматных баз данных, анализ окончаний, изменение правил14. Но 
для нас самое главное, что, в любом случае, это один из наиболее 
интересных случаев представления знаний. 

Задача представления знаний в интеллектуальных играх 
является вызовом для естественного интеллекта программистов. Дело 
в том, что некоторые из игр чрезвычайно сложны с количественной 
точки зрения. Например, шахматы имеют около 10% возможных 


12 >“ 
э возможных партии. Это огромные числа, 


позиций, и около 10 
, о 67 
большие, чем число атомов во Вселенной (по разным оценкам от 10 


до 10*°) и чем число секунд, прошедших от начала существования 


“ Любопытный пример. Ранее в шахматах действовало правило, что 
партия заканчивается вничью, если за пятьдесят ходов не было взятий или 
превращений. С помощью компьютерного анализа было найдено 
результативное окончание, которое требовало 53 хода. В итоге шахматные 
правила были изменены. 
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Вселенной”. Никакие информационные устройства не могут и 
никогда не смогут просмотреть или запомнить все позиции и 
разыграть все партии — это физически невозможно. Так что у 
разработчиков программ для интеллектуальных игр впереди 
непочатый край работы! 

Огромный вклад в алгоритмическое понимание шахмат внес 
М. М. Ботвинник. Михаил Моисеевич Ботвинник (1911—1995) — 
доктор технических наук, шестой чемпион мира по шахматам, 
носивший этот титул в общей сложности 13 лет. Первым уделил 
особое внимание вопросам тренировки шахматистов, создал свой 
метод подготовки к соревнованиям, в котором важное место 
уделялось физическим упражнениям и укреплению психологической 
устойчивости. Внёс ценный вклад в теорию многочисленных начал, 
разработал ряд оригинальных дебютных систем, обогатил ценными 
анализами теорию эндшпиля. «Я отдал шахматам, по-моему, все, 
что было возможно. Сейчас у меня просто нет времени готовиться 
к крупным турнирам. Когда я был занят одной электротехникой, 
работу удавалось сочетать с шахматами. Но уже несколько лет я 
работаю еще и над проблемой игры в шахматы на вычислительной 
машине и так погрузился в эту проблему, что сочетать все три 
занятия стало невозможно». 

Закончив в 1970 спортивные выступления («матч века» сборная 
СССР — сборная мира), Ботвинник занимался проблемами 
искусственного интеллекта, работал над компьютерной шахматной 
программой «Пионер». Идея создания «электронного шахматиста» 
возникла у него еще в 1958 году. В 1968 году вышла книга 
Ботвинника, в которой он сформулировал метод моделирования 
мышления шахматного мастера при выборе хода, построенного на 
позиционной оценке, отметающей все побочные и ненужные ходы и 
варианты. К сожалению, программа «Пионер» так и не была 


І 
°С момента большого взрыва всего-то прошло от 13 до 14 
17 
миллиардов лет, т. е. 5*10 ‘секунд. 
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реализована, но ценные идеи и решения Ботвинника остались в 
теории шахмат, и нашли свое применение в позднейших разработках 
отечественных специалистов по ИИ. 

Уже несколько десятилетий проводятся регулярные чемпионаты 
мира среди шахматных программ. В настоящее время Чемпионат 
проводится Международной ассоциацией компьютерных игр и 
открыт для всех типов компьютеров, у которых не более восьми ядер 
(то есть, исключая суперкомпьютеры и большие кластеры). Отрадно 
отметить, что на первых чемпионатах побеждала отечественная 
программа «Каисса», разработанная под руководством 
Г.М. Адельсона-Вельского и М.В. Донского. Чемпион последних трех 
лет — программа «Рыбка» («Кубка»), разработанная чешско- 
американским шахматистом Васиком Райлихом (Уаѕік Кајіеһ). 


1.2. МЕСТО ПРЕДСТАВЛЕНИЯ ЗНАНИЙ В 
ИСКУССТВЕННОМ ИНТЕЛЛЕКТЕ 


В интеллектуальной области невозможно создать 
универсальный алгоритм, подходящий для решения любой задачи. 
Этим интеллектуальные задачи отличаются от других, 
неинтеллектуальных, в которых существуют алгоритмы «делай раз, 
делай два, делай три...». Метод решения задачи в интеллектуальной 
области — это всегда поиск новых подходов, новых путей, в конце 
концов, если ничего не удается придумать — банальный перебор всех 
возможностей в поисках решения. 


1.2.1. Итеративный характер решения задач 


Общая схема решения проблемы с помощью компьютера 
изображена на Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..8. Стрелочки сверху вниз — детерминированный 
процесс, стрелочки снизу вверх — недетерминированный. Решение 
проблемы всегда носит, в целом, недетерминированный характер. Это 
метод проб и ошибок, метод поиска, в результате которого часто 
приходится возвращаться на предыдущие шаги. 
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Если обратная связь в таком процессе (стрелочки снизу вверх) 
реализуется через человека (а это происходит достаточно часто), то 
такой процесс не может называться компьютерной обработкой 
знаний. Для того чтобы можно было говорить именно о 
компьютерной обработке знаний, все или некоторые петли обратной 
связи должны замыкаться, соответственно, через компьютер. 


Постановка задачи 


Спецификация 


Проектирование 


Модель 


Реализация 


Код 


Реализацияневозможна 


Спецификациинеудовлетворены 


Программа неработает 


Тестирование и отладка 


Приложение 


Использование 


Замечания 


Анализ результатов 


Заказчикхочет не это 
Нета функция 


Найденыошибки 


Пользователь не понял 


Не удовлетворяютсяколичественные ограничения 


Рис. Ошибка! Текст указанного стиля в документе отсутствует..8. 
Схема процесса решения задачи на компьютере 

При традиционном процедурном программировании (сверху 
вниз), решение целиком зависит от задачи. Каждая задача имеет свое 


индивидуальное решение, и решение одной задачи не может быть 
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непосредственно, без дополнительной работы, использовано для 
решения другой. В искусственном интеллекте (непроцедурное 
программирование) один и тот же метод поиска может применяться к 
целому набору проблем. 

Наше резюме таково. Если задача не имеет прямого алгоритма 
решения, решается перебором, и возвраты осуществляются не через 
голову программиста, а через саму программу, то это прикладная 
система с элементами искусственного интеллекта. Если же задача 
имеет прямой алгоритм решения, который находит программист 
(может быть, за несколько попыток), но не сама программа, то 
искусственный интеллект отсутствует (возможно, присутствует 
естественный интеллект программиста). Но, фактически, 
непроходимой границы между этими случаями нет. Искусственная 
интеллектуальность программы не является дискретным свойством, 
принимающим только значения 0 или 1, всё или ничего. Напротив, 
искусственная интеллектуальность — это непрерывная величина, 
принимающая любые значения из интервала (0, 1). Чем больше 
петель обратной связи на Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..8 проходит не через голову программиста, а 
через компьютер, тем выше мера интеллектуальности программы. 


1.2.2. Знание и незнание 


Явно выраженную границу между знанием и незнанием указать 
невозможно. На самом деле точной границы для представления 
знаний в компьютере нет — всякая программа и всякие данные 
отражают какие-то знания. С другой стороны, самые тонкие 
философские соображения можно (на естественном языке) записать в 
компьютер, и они будут там представлены бессмысленной 
последовательностью байтов. Байты присутствовать в компьютере 
будут, но философские знания?.. Точнее говоря, ничто в компьютере 
не есть знания без нашей собственной интерпретации, и почти из 
всего можно извлечь знание, если как следует постараться. Более 


43 


строго, везде в этой книге (если явно не оговаривается иное) мы 
подразумеваем следующую трактовку понятия «знание»: 

Знания (компьютерные) — это совокупность строго 
фиксированных информационных структур и вполне определенных 
правил и стратегий обработки этих структур (правил 
интерпретации). 

Рассмотрим это на модельном примере. 

Допустим, мы хотим, чтобы компьютер отсортировал набор 
чисел в порядке их возрастания. Мы, люди, несомненно, знаем, как 
это сделать. Рассмотрим, можем ли мы научить это делать 
компьютер, то есть, можем ли мы представить необходимые знания в 
компьютере? Пусть нам заранее известно, что этих чисел три и они 
равны 3, 5 и 7. Можно научить компьютер решать данную задачу, 
написав всего один оператор: 

Музее (3, 5, 7) 

Таким образом, мы представили в компьютер знания, 
достаточные для решения этой отдельной частной задачи. Знания 
представлены в форме одного оператора языка программирования. 

Усложним задачу. Пусть чисел по-прежнему три, но при этом 
значение их произвольное. Составим процедуру, способную 
отсортировать эти числа по возрастанию: 


ртос Зов; А) 


ЇЁ х > у +Һеп х :=: у епа 1Е 
ЇЁ у > 2 Бер у :=: 2 епа і 
ЇЁ х > у +Һеп х :=: у епа і 


Агіе (х, у, 2) 
епа ргос 

Таким образом, мы научили компьютер решать довольно 
большое множество задач, связанных с сортировкой трех чисел по 
возрастанию, не слишком удлинив при этом запись. Во всяком 
случае, данная запись намного меньше, чем все возможные операторы 
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Мх16е со всеми возможными комбинациями аргументов”. Знания 
представлены в форме процедуры с параметрами. Другими словами, 
механизм процедур в языках программирования — это уже метод 
представления знаний. Просто это достаточно старый метод, мы к 
нему привыкли, и не воспринимаем как механизм представления 
знаний. 

Возникает еще один вопрос: откуда взялась процедура 5охЕ3? 

Можно сказать, что, как обычно, ее придумал программист. Но 
мы дадим не совсем привычный ответ, показав, как можно 
представить в программе знания, достаточные для того, чтобы 
компьютер сам придумал процедуру, подобную ЗогЕЗ. 

Так как в процедуре ЅогЕЗ есть фрагменты кода, похожие друг 
на друга, и их болыше двух, следует применить специальный 
рефакторинг (преобразование текста программы, не меняющее 
выполняемую программой функцию), который называется 
запроцедуривание. Запроцедуривание — это такой рефакторинг, при 
котором повторяющиеся или похожие фрагменты программы 
заменяются вызовом вновь введенной процедуры. Переписав 
процедуру 5огЕЗ, введя процедуру 5огЕ2, получаем процедуру 
ОА 
Ртос БОЕ” (ху урхи) 


БоЕЕ2 (5. =) 

БОЕ у 005) 

БОЕ Уу) 

Агіе (х, у, 2) 
епа ргос 
ргос Зогі2 (и, у) 

1Е ип > у Вет и :=: у епа 1Е 
епа ргос 


1 
3 Заметим , что поскольку количество различных чисел, 


представимых в компьютере, конечно, количество различных операторов 
гі Се с различными аргументами также конечно, хотя и довольно велико. 
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Но процедуру 5окЕ2 нетрудно специфицировать формально: 
Ир. оО р Т у 

Здесь перед заголовком процедуры (который заключен в 
фигурные скобки) выписано предусловие, а после заголовка — 
постусловие. Процедура 5окгЕ2 очень проста и очевидно полезна во 
многих случаях. Можно допустить, что эта процедура вместе со 
спецификацией (предусловие и постусловие) содержится в 
библиотеке готовых процедур, доступной транслятору. 

Предусловие — формальное утверждение о входных 
параметрах фрагмента на языке программирования (например, 
процедуры), которое должно быть выполнено до начала выполнения 
фрагмента для того, чтобы фрагмент проработал правильно. 

Постусловие — формальное утверждение о входных и 
выходных параметрах фрагмента языка программирования, 
выполнение которого гарантируется после окончания выполнения 
фрагмента в случае, если было выполнено предусловие. 

Тогда, используя эту спецификацию, транслятор может 
логически вывести процедуру ЗохЕЗ': 

х, у, 2 

ОЕА уут асуу ти 
ОА у т) е пи аи 
оопа оо ОЕ В. 

Таким образом, мы немного усложнили механизм транслятора 
(допустив возможность логического вывода при трансляции) и 
получили систему автоматического синтеза программ. Другими 
словами, мы компактно записали не одну процедуру Ѕогі 3, а целый 
класс процедур. В этом случае знания представлены в виде 
специфицированной процедуры и алгоритма логического вывода, 
встроенного в транслятор. 

Кажется, что понятия «знание» и «процедура» ортогональны. 
Если есть процедура, никакие знания не нужны — делай, как сказано 
в процедуре, и задача будет решена. Приведенный пример 
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показывает, что понятия «знание» и «процедура» (или, лучше сказать, 
алгоритм) не только не противоположны, но даже, можно сказать, 
неразделимы. 

Любой алгоритм обязательно содержит знания, а любые 
знания представляются, в конечном счете, алгоритмами. 


1.2.3. Алгоритмы поиска решения и представление знаний 


Первый этап развития ИИ был связан с разработкой методов 
решения задач — алгоритмов поиска решения и построения 
логического вывода. В настоящее время это уже достаточно 
проработанный и изученный вопрос. Основные классические 
результаты изложены в третьей главе. 

Однако для нетривиальных случаев трудоемкость поиска 
решения очень велика. Трудоемкость поиска решения — это 
быстрорастущая функция (в большинстве случаев растущая как 
экспонента или быстрее), аргументом которой является общий объем 
базы знаний. Рассматривая ниже конкретные алгоритмы, мы 
доказываем точные оценки, но здесь, на неформальном уровне, хотим 
убедить читателя в справедливости этого замечания. Пусть искомое 
решение является комбинацией конечного числа заранее заданных 
элементов, которых и. Тогда всего существует 2"—1 непустых 
комбинаций”, если брать элементы без повторений, а если с 
повторениями, то еще больше. Заранее мы не знаем, какая 
комбинация является решением, в этом и состоит поисковый характер 
алгоритма, а значит, в худшем случае нам придется перебрать все 
комбинации! 

Один из способов уменьшения трудоемкости поиска решения 
является изменение алгоритмов поиска с целью повышения их 
внутренней эффективности, не зависящей от решаемой задачи. 
Однако для очень многих задач, типичных для ИИ, доказана их №Р- 
полнота. Построение эффективного (более эффективного, чем 


17 
Это число непустых подмножеств множества из и элементов. 


47 


экспонента) алгоритма для них совершенно невероятно. Если для 
какой-то еще не исследованной задачи ИИ вдруг обнаруживается 
эффективный (скажем, полиномиальный) алгоритм, то задачу часто 
перестают квалифицировать как задачу ИИ, и переносят в область 
обычного программирования. Таким образом, в настоящий момент 
существенного улучшения в повышении внутренней эффективности 
алгоритмов поиска ожидать трудно. 

Гораздо более продуктивным методом, позволяющим 
уменьшить трудоемкость поиска решения, является повышение 
эффективности представление знаний. Если выбор изощренного 
представления позволяет уменьшить объем базы знаний, то тот же 
стандартный алгоритм поиска становится значительно эффективнее в 
том смысле, что расширяются границы его применимости. Поясним 
это модельным числовым примером, сравнивающим два 
гипотетических способа представления знаний. Пусть одна и та же 
задача в первом представлении имеет размер п, а во втором - 2/2. 
Пусть переборный алгоритм один и тот же, и имеет трудоёмкость 2“, 
где К – размер задачи. Пусть, при этом, более компактное 
представление дается не даром: каждый шаг перебора выполняется в 
десять раз дольше и еще 100 единиц времени безвозвратно теряется 
на предварительную обработку. Фактически, мы сравниваем две 
функции: 2" и 100 + 10*2", При малых и первая функция меньше, но 
после и=8 вторая функция становится меньше, и ее преимущество 
только возрастает с ростом п (Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..9). Даже небольшой выигрыш в значении 
аргумента показательной функции перевешивает все другие 
проигрыши! 
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—_— 100+10*2^(п/2) 


Рис. Ошибка! Текст указанного стиля в документе отсутствует..9. 
Сравнение трудоемкости поиска в зависимости от компактности базы 
знаний 

Компактность базы знаний — определяющий фактор 
эффективности искусственно-интеллектуальной системы и, 
следовательно, границ ее применимости. Именно это обстоятельство 
определяет структуру данной книги. Главы структурированы по 
методам представления знаний, а не по методам поиска решения. При 
решении любой задачи в интеллектуальной области сначала следует 
выбрать представление знаний, потом подобрать подходящий 
алгоритм поиска решения. Дело в том, что если выбрано неудачное 
представление знаний, то никакие ухищрения с алгоритмами не 
помогут. Если же изобретено особо удачное представление знаний, 
то, скорее всего, самый обычный алгоритм поиска решения даст 
вполне удовлетворительные результаты. 


1.3. ИСТОРИЯ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 


Экскурс в историю часто бывает совершенно необходим, иначе 
непонятно, почему рассматриваемые современные положения именно 
таковы, каковы они есть. Ведь положения и концепции ИИ носят во 
многом субъективный характер, объясняются историческими и 


психологическими причинами. Этим положения ИИ заметно 
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отличаются от объективно обусловленных законов физики или 
химии. Мы разбили историю развития ИИ на несколько периодов (Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..10): 

- доисторический, когда даже термина «искусственный 
интеллект» еще не существо, но некоторые работы можно, 
ретроспективно и с некоторой натяжкой, отнести к данному 
направлению °; 

- пионерский, когда появление компьютеров и другие 
достижения техники ХХ века резко расширило горизонты возможных 
исследований, когда почти каждая предлагаемая идея ошеломляла 
своей новизной и открывала новые перспективы, причем идеи 
возникали как фейерверк, одна за другой; 

- академический, когда направление ИИ оформилось как 
отдельное направление исследований в науке, со своей 
терминологией, авторитетами, исследовательскими центрами и 
образованием международного сообщества; когда исследования 
велись в основном в интересах развития самого направления, а 
практические приложения были интересны, прежде всего, самой 
принципиальной возможностью реализации, а не тактико- 
техническими характеристиками; 

- промышленный, продолжающийся и развивающийся в наши 
дни, когда возросшие возможности техники открыли дорогу к 
массовому промышленному применению прикладных систем 
искусственного интеллекта. 

Конечно, не следует думать, что эти периоды сменяли и 
сменяют друг друга строго последовательно, наподобие пятилетних 
планов развития социалистической экономики. И в пионерский, и в 
академический периоды были отдельные промышленные образцы, 


'“ При появлении принципиально новых направлений, особенно 
новых направлений мысли, всегда стараются отыскать аналог или 
предтечу, причем, чем древнее историческая ссылка, тем уютнее новому 
направлению на первых порах. 


50 


оставившие след в истории, и даже в наше меркантильное время 
случаются, хотя и не часто, научные прорывы, скачком ведущие к 
«сдвигу парадигмы». 


1.3.1. Предыстория искусственного интеллекта 


Достоверно зафиксированные первые попытки создать 
машину, моделирующую некоторые аспекты человеческого 
разума, предпринял Раймунд Луллий более 700 лет назад. Луллий 
полагал, что возможно открыть особый метод или искусство, 
посредством которого можно с разумной необходимостью вывести из 
общих понятий всякие истины, и, прежде всего — истины 
христианского вероучения. Основываясь на своих представлениях, он 
создал первую логическую машину в виде нескольких 
концентрических бумажных кругов, размеченных на отделения, в 
которых помещались общие понятия и категории. Вращая круги друг 
относительно друга, можно было получать различные более или 
менее сложные комбинации обозначенных понятий. Луллий полагал, 
что таким образом можно открыть новые реальные истины. 
Разумеется, никаких новых истин открыто не было, но идея, что 
рассуждение можно провести механически, прозвучала! 

Сейчас мы знаем, что логические операции можно трактовать с 
алгебраической точки зрения и выполнять как арифметические, но до 
работ Дж. Буля (б. ВооІе) в ХІХ веке это было далеко не так 
очевидно. Поэтому внимание первых конструкторов 
интеллектуальных машин было направлено на построение машин, 
способных вычислять. Логические рассуждения казались более 
сложной задачей, Таких «вычислительных машин» было 
сконструировано несколько в ХУП-ХУШ веках, и здесь необходимо 
упомянуть арифметическую машину Лейбница, которая была первой 
в мире машиной, предназначенной для эффективного выполнения 
всех четырех действий арифметики. 

Над этой машиной Г. Лейбниц начал работать в 1670 году; через 
два года он составил новое эскизное описание, на основе которого 
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был, по-видимому, изготовлен тот экземпляр, который ученый 
продемонстрировал в феврале 1673 года на заседании лондонского 
Королевского общества. Лейбниц признал, что его инструмент еще 
несовершенен, и обещал улучшить его, как только вернется в Париж. 
Действительно, в последующие годы он внес существенные 
усовершенствования в машину, но к ее окончательному варианту 
пришел лишь в 1694 году. Впоследствии Лейбниц еще несколько раз 
возвращался к своему изобретению, предлагая новые, 
усовершенствованные варианты. 

Венцом предыстории компьютеров являются работы Чарльза 
Бэббиджа (Сһагіеѕ ВаБбағсе). Бэббидж начал с механического 
аппарата, предназначенного для автоматизации вычислений путём 
аппроксимации функций многочленами и вычисления конечных 
разностей. Возможность приближённого представления 
многочленами логарифмов и тригонометрических функций позволяет 
рассматривать эту машину как довольно универсальный 
вычислительный прибор. Эта разностная машина должна была уметь 
вычислять значения многочленов до шестой степени с точностью до 
18-го знака. В том же 1822 году Бэббиджем была построена модель 
разностной машины, состоящая из валиков и шестерней, вращаемых 
вручную при помощи специального рычага. В следующем году 
правительство Великобритании предоставило ему субсидию в 
размере 1500 фунтов стерлингов. Разрабатывая машину, Бэббидж и не 
представлял всех технических и механический трудностей, связанных 
с её реализацией, и не только не уложился в обещанные три года, но 
спустя девять лет вынужден был приостановить свою работу. Однако 
часть машины все же начала функционировать, и производила 
вычисления даже с большей точностью, чем ожидалось. 

В 1834 Бэббидж изобрел аналитическую машину. Она состояла 
из «склада» для хранения чисел (запоминающее устройство), 
«мельницы» для производства арифметических действий над числами 
(арифметическое устройство), «барабана», управлявшего в 
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определенной последовательности операциями машины (устройство 
управления), а также устройств ввода и вывода данных. Регистровая 
память машины Бэббиджа была способна хранить как минимум 10 
десятичных чисел по 40 знаков, теоретически же могла быть 
расширена до тысячи 50-разрядных. Арифметическое устройство 
имело аппаратную поддержку всех четырех действий арифметики. 
Машина производила сложение за 3 секунды, умножение и 
деление — за 2 минуты. На вход машины должны были поступать два 
потока перфокарт, которые Бэббидж назвал «операционными 
картами» и «картами переменных»: первые управляли процессом 
обработки данных, которые были записаны на вторых. Информация 
заносилась на перфокарты путем пробивки отверстий. Из 
операционных карт можно было составить библиотеку функций. 
Таким образом, все основные элементы архитектуры первых 
компьютеров были Бэббиджем предвосхищены в полной мере. 
Аналитическая машина так и не была реализована. Основная причина 
неудачи — технологическая. Технологии того времени не позволяли 
изготовить в достаточном количестве и достаточно точно 
необходимые сложные детали. Изобретатель писал в 1851 г.: «Все 
разработки, связанные с аналитической машиной, выполнены за мой 
счет. Я провел целый ряд экспериментов и дошел до черты, за 
которой моих возможностей не хватает. В связи с этим я вынужден 
отказаться от дальнейшей работы». 


1.3.2. Пионерские исследования 


Серьезное развитие искусственного интеллекта как научного 
направления началось в 40-х годах прошлого столетия, после 
появления ЭВМ. В 1948 году Норберт Винер опубликовал книгу 
«Кибернетика, или управление и связь в животном мире и машине», 


тем самым, основав новую науку — кибернетику. 
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Хотя в названии книги Винера мышление не упоминается, но 
одиозный вопрос «могут ли машины мыслить?» впервые прозвучал 
в знаменитой статье Тьюринга уже два года спустя. (В этой статье, в 
частности, был впервые сформулирован конструктивный критерий 
наличия у машины ИИ, так называемый тест Тьюринга). 

По отношению к этому вопросу мнения разделились не только у 
сторонних наблюдателей, журналистов и широкой публики, но и у 
самих ученых, начинавших работать в области ИИ. Конечно, в целом 
ответ у работающих исследователей был положительным. Тонкость 
заключается в том, что можно поставить два похожих вопроса: 

Может ли машина мыслить как человек? 

Может ли машина мыслить рационально? 

Поиски конструктивного ответа на первый вопрос ведут к 
моделированию мышления человека, при котором считается важным 
не только получение ответа на интеллектуальный вопрос, но и анализ 
средств достижения ответа. Это направление получило название 
«нейрокибернетика». 

Основным методом нейрокибернетики является математическое 
моделирование работы человеческого мозга. Еще в 1943 году 
американские ученые Уоррен Мак-Каллок и Уолтер Питтс 
предложили математическую модель работы нейрона человеческого 
мозга — искусственный нейрон — и способы комбинирования 
искусственных нейронов в нейронную сеть. 

Затем последовали пионерские работы Розенблатта, Минского и 
других исследователей. Однако в 70-х годах работы в этом 
направлении несколько замедлились, что связано с невысокими 
количественными возможностями компьютеров того времени. Дело в 
том, что в мозгу человека параллельно работают от 10 до 14 
миллиардов (10°) нейронов, и каждый имеет в среднем около семи 
тысяч (10°) связей с другими нейронами. Число искусственных 


' Наш ответ таков: также как и люди. В некоторых случаях 
некоторые экземпляры могут, но далеко не все и не всегда. 
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нейронов в первых сетях измерялось сотнями, в лучшем случае 
тысячами, но столь большие количественные отличия (в миллионы 
раз) образуют качественную пропасть — на маленьких моделях 
невозможно исследовать большие системы. Заметим, что 
количественные показатели человеческого мозга до сих пор не 
достигнуты в нейронных сетях?, но масштабы постепенно становятся 
соизмеримыми 

Отвечая на второй вопрос, мы приходим к кибернетике 
«черного ящика», когда наблюдаются только вход и выход, стимул и 
реакция, а внутреннее устройство «мыслящего агента» скрыто от 
наблюдения. В отличие от нейрокибернетики, для кибернетики 
«черного ящика» неважно, как устроено «мыслящие» устройство. 
Главное, чтобы на заданные входные воздействия оно реагировало 
так же, как человеческий мозг, то есть рационально. 

Исследователи данного направления сразу же перешли от 
сверхсложных параллельных недетерминированных сетей 
нейрокибернетики к сравнительно простым алгоритмическим 
моделям, манипулирующим абстрактными символами, а не 
реальными сигналами. Именно поэтому мы предпочитаем термин 
символический ИИ (см. Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..10). 

Самой заметной пионерской работой этого направления была 
программа «Логик-теоретик», разработанная А. Ньюэллом, 
Г. Саймоном и Дж. Шоу в 1955—1956 годах. Программа работала в 
области автоматического доказательства теорем и смогла 
автоматически найти вывод для 38 из 52 теорем исчисления 
высказываний, приведенных в фундаментальной книги Рассела и 


В рамках одного из лучших современных проектов Меигоема 
построен тиражируемый нейрокомпьютер, который содержит 16 
«нейроядер», каждое из которых содержит 65 536 программируемых 
искусственных нейронов, то есть всего около миллиона (10°) нейронов. 
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Уйатхеда Ргіпсіріа Машйетанса, причем в одном случае был найден 
более короткий, по сравнению с оригиналом, вывод. 

По поводу этого несомненного достижения в литературе 
высказано столько различных, а иногда удивительных мнений и 
оценок, что мы считаем допустимым на примере программы «Логик- 
теоретик» дать свои выводы по универсальным программам 
автоматического доказательства теорем, а тем самым, по 
универсальным интеллектуальным программам в целом (см. также 
параграф 0). 

1. Автоматически доказанные теоремы не несут нового 
математического знания: в случае программы «Логик-теоретик» это 
простые технические теоремы исчисления высказываний. Их 
справедливость легко проверяется построением таблиц истинности. 
Задача состоит только в том, чтобы найти формальный вывод 
(последовательность формул) в заданной аксиоматике и с заданными 
правилами вывода. Поиск вывода не требует новых идей или методов, 
он опирается на вполне рутинные приемы. Среди обсуждаемых 
выводов нет выводов короче, чем в три применения правил вывода, и 
нет выводов длиннее, чем в две дюжины применений правил вывода. 
Результаты, полученные программой «Логик-теоретик», не имеют 
практической значимости. 

2. Многолетние наблюдения автора за студентами, изучающими 
исчисление высказываний, и вынужденными в рамках учебного 
процесса искать и находить подобные выводы, позволяют 
утверждать, что средний человек «с улицы» без специальной 
подготовки не найдет ни одного из формальных доказательств, 
найденных программой «Логик-теоретик». Человек «с улицы» просто 
не поймет, что нужно сделать, потому что заведомо никогда ничего 
подобного не делал. Так что неподготовленный человек уступает в 
этом искусстве программе «Логик-теоретик». В то же время, 
прилежные студенты, после проведения трех-четырех сеансов 
упражнений с преподавателем, в состоянии найти любой из этих 
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выводов, а Также те выводы, которые программа найти не смогла. 
Следует оговориться, что выводы, найденные студентами, могут быть 
не такими элегантными, как у Рассела и Уайтхеда, и найдены будут 
не очень быстро. Но, тем не менее, можно утверждать, что человек, 
который в состоянии сдать вступительные экзамены в университет, 
также в состоянии научиться искать формальные выводы не хуже, 
чем это может делать программа «Логик-теоретик». 

3.С качественной точки зрения, результаты, достигнутые 
программой «Логик-теоретик», за прошедшие полвека с лишним, 
были улучшены незначительно. Дело в том, что задача 
автоматического поиска вывода в исчислении высказываний имеет 
переборный характер (см. параграф 0). Современные компьютеры в 
миллионы и миллиарды раз мощнее того компьютера, которым 
пользовался Шоу, однако современные универсальные программы 
поиска логического вывода могут построить только в десятки, от 
силы в сотни раз более сложные выводы, поэтому на качественном 
уровне первые два замечания в этом списке остаются в силе и в наши 
дни, и применимы не только к программе «Логик-теоретик», а к 
любой современной программе, которая претендует на 
автоматическое доказательство произвольных теорем в достаточно 


богатом исчислении. 
1.3.3. Становление и развитие 


В 1956 году в Дартмутском колледже (один из старейших 
университетов США) был проведен двухмесячный семинар, в 
котором приняло участие десять ведущих исследователей нового 
направления: 

- Джон Маккарти (Јоһп МсСагћу), Дартмутский колледж; 

- Марвин Минский (Магуіп МіпѕКу), Гарвардский университет; 

- Клод Шеннон (СІаџе Ѕһаппоп), Вей Габогаюнез; 

- Натаниэль Рочестер (Мафапе] Косһеѕѓег), ІВМ; 

- Артур Самюэль (Агіһиг Ѕатоие]), ІВМ; 

- Аллен Ньюэлл (АПеп №е\меП), университет Карнеги-Меллон; 
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- Герберт Саймон (Негбегі Ѕітоп), университет Карнеги- 
Меллон; 

- Тренчард Мур (Тгепсһага Мооге), Принстонский университет; 

- Рей Соломонов (Кау  э0отопой), Массачусетский 
технологический институт; 

- Оливер Селфридж (Оһуег Зере), Массачусетский 
технологический институт. 

Этот семинар принято считать началом искусственного 
интеллекта как самостоятельного направления, именно на нем был 
предложен и утвержден сам термин искусственный интеллект 
(агаЯс1а! шеШоепсе). Никаких особенных научных результатов 
Дартмутский семинар не дал. На нем произошли другие важнейшие 
события: искусственный интеллект был признан самостоятельной 
отраслью науки, были продемонстрированы первые впечатляющие 
результаты (подобные программе «Логик-теоретик») и было 
образовано научное сообщество в результате личного знакомства 
лидеров. 

После этого исследования в области ИИ стали вестись широким 
фронтом, и не только в США. Стали появляться первые публикации, в 
которых делались попытки обобщения накопленного материала. 
Среди специалистов, выступивших с такими работами, были 
Дж. Маккарти, М. Минский, Э. Фейгенбаум (Е. Еесепбаит, США), 
Д. Мичи (р. Меше, Великобритания), А. А. Ляпунов и В. М. Глушков 
(СССР). Разумеется, результаты не заставили себя ждать — было 
предложено множество идей, большинство из которых используются 
и в наши дни. 

В конце 1950-х гг. была предложена модель поиска на графе. В 
рамках данного подхода, задача представляется в виде поиска пути в 
графе, вершинами которого являются состояния задачи, а дугами — 
все возможные допустимые преобразования. Решение задачи состоит 
в поиске пути от исходного состояния к целевому. В начале 1960-х гг. 
получило широкое распространение эвристическое 
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программирование (см. главу 3). Эвристикой называется правило, 
обычно полученное эмпирическим путем, позволяющее сократить 
объем перебора в пространстве решений. Эвристическое 
программирование — разработка стратегий поиска решения на основе 
заранее известных эвристик. В конце 1960-х гг. были разработаны 
общие методы автоматического доказательства теорем в исчислениях 
первого порядка (в частности, метод резолюций Дж. Робинсона (1. 
Кобпѕоп) и обратный метод С.Ю. Маслова, см. главу 4), и на их 
основе в начале 1970-х гг. были предложены многочисленные 
инструментальные средства программирования решения 
интеллектуальных задач. Так, в 1973 г. был создан язык Пролог, 
который является популярным средством логического 
программирования до сих пор. Практически весь запас идей и 
концепций, которыми оперируют в ИИ сейчас, был предложен или 
обозначен в этот период. Перечислить все идеи невозможно, да в этом 
и нет нужды, если ясна общая схема развития (см. Рис. Ошибка! Текст 


указанного стиля в документе отсутствует..10). 
1.3.4. Научная консолидация и промышленное внедрение 


С нашей точки зрения, наиболее важным для ИИ событием 80- 
х гг. было появление концепции инженерии знаний. Эта концепция 
была выдвинута Э. Фейгенбаумом в 1982 г. 

Инженерия знаний (Кпоу[е4зе епотеепиз)— область 
искусственного интеллекта, которая изучает методы и средства 
извлечения, представления, структурирования и использования 
знаний. 

Отделение методов представления знаний от методов поиска 
решения, построение все более эффективных специализированных 
приемов представления знаний в конкретных предметных областях 
позволило получать достаточно эффективные представления, чтобы 
имеющимися методами на реальных компьютерах решать 
практически значимые задачи. Одновременно с этим, обретя общий 
методологический базис, различные подходы и направления внутри 
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ИИ стали теснее интегрироваться друг с другом, поскольку не нужно 
было доказывать «чистоту теории» или «оригинальность подхода», а 
нужно было любым способом получить практический результат. 

В этот период стали появляться компьютерные системы, 
которые были весьма далеки от прохождения теста Тьюринга, зато 
положительно отвечали на такие вопросы: может ли машина решать 
некоторые интеллектуальные проблемы дешевле, чем человек? 
Быстрее, чем человек? Безотказнее, чем человек? 

Возможности вычислительной техники заметно возросли, и 
стало ясно, что если оставить в стороне философские, этические и 
моральные вопросы «искусственного разума», то во многих 
конкретных узко специальных областях не только можно, но и 
выгодно заменить человека машиной. Прикладные системы 
искусственного интеллекта стали приносить прибыль. Немедленно 
стали увеличиваться инвестиции в академические исследования, 
которые стали давать новые результаты, которые внедрялись в 
промышленность, которая приносила доход, который частично 
вкладывался в исследования... Возникла положительная обратная 
связь, и период подъема ИИ еще не завершен! 

Вторым значимым событием этого периода стало возрождение, 
после определенного затишья, нейрокибернетики с концепциями 
нейронных сетей и нейрокомпьютеров. Возобновление интереса не 
было вызвано каким-либо внезапным чудесным откровением свыше с 
популярным разъяснением, как именно устроен и работает мозг 
человека. Конечно, физиологи, психологи, лингвисты, философы и 
другие исследователи не сидели сложа руки, а узнали и придумали 
про нашу человеческую природу много нового, но причина была не в 
этом. Внутри самой нейрокибернетики также не было сделано 
эпохальных открытий. В современных нейросетях используются 
математические модели, очень близкие к первоначальным, хотя, 
конечно, во многом развитые и усовершенствованные. Очевидная 
причина возрождения нейрокибернетики заключается В 
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поразительных успехах микроэлектроники. В пионерских работах, 
подобных персептрону Розенблатта, количественные различия между 
искусственными и естественными нейронными сетями измерялись 
многими миллиардами раз, и ни о каком качественном сопоставлении 
речи не было. Сейчас количественные различия измеряются тысячами 
раз, и у конструкторов супернейрокомпьютеров появились 
невиданные ранее возможности. Следует ожидать качественных 
изменений, к которым должны привести происходящие 
количественные изменения. 

Третьим примечательным событием уже сравнительно 
недавнего прошлого мы считаем привнесение заслуженного 
философского понятия «онтология» на свежую почву информатики. 

Онтология (опіоіову) — это формализации некоторой области 
знаний с помощью концептуальной схемы. Обычно такая схема 
состоит из структуры данных, содержащей все релевантные классы 
объектов, их связи и ограничения, наложенные на объекты и связи. 

Онтологии используются в процессе программирования как 
форма представления знаний о реальном мире или его части, иначе 
говоря, как модель предметной области. Хотя термин «онтология» 
изначально философский’, в информатике он принял 
самостоятельное значение. Здесь есть два существенных отличия: 

- онтология в информатике является формой представления 
знаний, причем такой формой, которую компьютер сможет легко 
обработать; 

- информационные онтологии создаются всегда с конкретными 
целями решения практических задач; они оцениваются больше с 
точки зрения применимости, чем полноты, замкнутости и 
корректности. 


21 
Онтология (древнегреческие корни «онто» — сущее, то, что 


существует и «логия» — учение, наука) — раздел философии, изучающий 
бытие. 
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Автор совершенно убежден, что анализ, построение, развитие и 
использование моделей предметной области — самая важная и 
перспективная задача информатики в настоящее время, причем не 
только в ИИ, но и в других информационных технологиях. 
Достаточно упомянуть, например, концепцию систем управления 
бизнес-процессами (Визшез$ Ргосеѕѕ Мапасетепе 5уѕѓетѕ — ВРМЪ) в 
области информационно-управляющих систем, концепцию 
семантической паутины (Зетапис УМеБЬ) в Интернете или концепцию 
проблемно-ориентированных языков (Роташ Ѕресійс Гапецасез) в 
прикладном программировании. Все эти перспективные концепции 
апеллируют к понятию онтология”. 

Рис. Ошибка! Текст указанного стиля в документе отсутствует..10 
отражает наше видение истории развития ИИ и подводит итог 
разделу. 


2 Вместе с тем, нельзя не отметить, что апологеты концепции 
онтологии в информатике пока обещают больше, чем реально могут 
сделать. В этом они уподобляются пионерам ИИ 50-х гг., которые обещали 
появление «искусственного разума» через 10—20 лет. Завышенные 
обещания ведут к охлаждению интереса... 
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Рис. Ошибка! Текст указанного стиля в документе отсутствует..10. 
История развития искусственного интеллекта 


1.4. КЛАССИФИКАЦИИ ПРИКЛАДНЫХ СИСТЕМ 
ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 


Прикладные системы и области, в которых используется 


искусственный интеллект, весьма разнообразны — раздел 0 дает 
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только небольшой набор учебных примеров, но не 
энциклопедический обзор. На самом деле в реальной практике 
применяются тысячи прикладных систем ИИ, и каждая имеет свои 
особенности и отличительные черты. Такое разнородное собрание 
объектов и методов нуждается в классификации, даже в нескольких 
классификациях, одной не обойтись. 


1.4.1. Виды знаний 


Знания, которые мы собираемся представлять в компьютере, 
весьма разнообразны. 

Следуя С.С. Лаврову [4], знания можно разделить на три 
принципиально разных вида: 

1. Понятийные, концептуальные знания. К этой группе 
относятся понятия и взаимосвязи между ними, например, правила, 
законы, инвариантные соотношения, а также эвристические знания — 
неформальные правила рассуждений, отражающие практический 
опыт решения задач в проблемной области. 

2. ПроцедурныеОшибка! Закладка не определена., 
алгоритмические знания. Сюда можно отнести различные умения, 
технологии, процедуры, алгоритмы, их программные реализации и 
типовые процедуры решения задач — т.е. те формы знаний, которые 
фактически всегда явно используются для компьютерного решения 
любой задачи. 

3. Фактографические знания. Это самые разнообразные 
количественные и качественные характеристики конкретных 
объектов, т.е. факты. Например, различные данные в базах данных, 
константы в программах и т.д. 

Конечно, между видами знаний нет непроходимой границы (см. 
также параграф 0). Более того, иногда бывает так, что знание трудно 
отнести к одному конкретному виду. Например, алгоритмы 
вычисления математических функций (510, соѕ, и т.д.) для 
эффективности представляют в виде набора коэффициентов 
разложения по специальным полиномам. Эти коэффициенты, 
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конечно, являются данными, то есть фактографическим знанием, а 
используются как алгоритмическое знание. Тем не менее, указанная 
классификация знаний очень полезна и действенна при обсуждении 
прикладных систем искусственного интеллекта, поскольку позволяет 
сосредоточиться на важных для ИИ вопросах представления 
концептуальных знаний, используя приемы представления 
алгоритмических и фактографических знаний как готовый базис. 

Классификация знаний по Лаврову принимается как 
основополагающая в этой книге. 

Лавров Святослав Сергеевич, 1923—2004, — российский ученый, 
член-корреспондент РАН. Автор трудов по механике, 
автоматическому управлению, вычислительной математике и 
программированию. Лауреат Ленинской премии 1957 года. Научная 
биография Лаврова в определенном смысле уникальна. Совсем в 
молодом возрасте он стал основоположником ракетно-космической 
баллистики в СССР и неоспоримым авторитетом в области динамики 
управляемого полета и автоматического управления. Появление 
цифровой вычислительной техники привело к резкому повороту в 
деятельности С. С. Лаврова и в течение нескольких лет сделало его 
классиком программирования в СССР. 


1.4.2. Классификация по степени использования различных 
видов знаний 


В зависимости от того, какие виды знаний используются, и 
каким образом это происходит, системы искусственного интеллекта 
можно классифицировать несколькими способами. 

1. Если в программной системе используются только 
фактографические знания, то такую программную систему называют 
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базой данных (БД) и в современных условиях обычно не считают 
содержащей искусственный интеллект.” 

2. Если в программной системе используются главным образом 
алгоритмические знания, то такую программную систему принято 
называть пакетом прикладных программ. Отнесение такого пакета 
программ к системе ИИ обычно явно указывается. Если пакет 
прикладных программ используется просто как библиотека процедур, 
то его не относят к искусственно-интеллектуальным системам. Если 
же в нем используются методы ИИ, например, если программу 
решения конкретной задачи строит не пользователь, а 
автоматический планировщик, то такой пакет прикладных программ 
может считаться системой с искусственным интеллектом. 

3. Если в программной системе в той или иной форме 
используются концептуальные знания, то такую систему считают 
искусственно-интеллектуальной. 

Заметим, что, как правило, развитые пакеты прикладных 
программ имеют в своем составе или активно используют внешнюю 
базу данных, а прикладные системы ИИ почти всегда используют как 
пакеты программ, так и базы данных (Рис. Ошибка! Текст указанного 
стиля в документе отсутствует..11). Например, развитая шахматная 
программа имеет огромную базу данных дебютов и эндшпилей, 
специальный пакет программ для работы с позициями и ходами во 
время партии, и набор стратегических правил выбора хода, которые 
относятся к понятийным знаниям. 


2 

° Следует заметить, что такие современные технологии баз данных, 
как извлечение знаний из данных (ӣаќа птіпіпо), скорее следует относить к 
области ИИ, чем к области систем управления базами данных. 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..11. Классификация прикладных систем с элементами 
искусственного интеллекта по типам используемых знаний. 


Предметом этой книги являются именно прикладные системы 
искусственного интеллекта. При этом мы считаем, что читатель в 
достаточной степени знаком с концепциями пакетов программ и баз 
данных, поэтому все внимание концентрируется на представлении 
понятийных знаний. 


1.4.3. Классификация по форме представления знаний 


Когда осознана и прочувствована необходимость совместного 
использования знаний всех трех типов, возникает потребность в 
выборе способа их представления в компьютере. Мощные 
механизмы, которые использует человек для представления знаний: 
естественные языки, математика, визуальные образы, — пригодны 
для представления всех видов знаний, но непригодны для реализации 
в компьютере. Точнее говоря, наоборот, современные компьютеры 
непригодны для использования этих механизмов — компьютеры 
слишком примитивны и неинтеллектуальны. 

Таким образом, возникает необходимость изобретения таких 
способов представления знаний, которые, с одной стороны, 
позволяли бы представлять знания всех видов, и, с другой стороны, 
были бы реализуемы в современных компьютерах. 
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Механизмы для представления фактографических и 
алгоритмических знаний в компьютерах хорошо изучены и устоялись. 
Для фактографических знаний — это системы управления базами 
данных (СУБД), в современных условиях чаще всего реляционные. 
Для алгоритмических знаний — это библиотеки процедур, в 
современных условиях чаще всего объектно-ориентированные, то 
есть библиотеки типов и классов. 

Таким образом, классификация по форме представления знаний 
рассматривает, прежде всего, представление концептуальных знаний. 

Предлагается множество различных механизмов представления 
концептуальных знаний. Чаще всего сейчас применяются следующие 
три (Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..12). 

Правила, или продукции. Системы искусственного интеллекта, 
основанные на правилах, в настоящее время встречаются чаще всего. 
С математической точки зрения такие системы используют модели 
вычислимости, близкие к нормальным алгорифмам Маркова. 
Системы продукций детально рассматриваются во второй и третьей 
главах данной книги. 

Формулы логических исчислений. Системы искусственного 
интеллекта, основанные на логических формулах, в настоящее время 
занимают второе место по распространенности. С математической 
точки зрения такие системы используют исчисления, близкие к 
исчислению предикатов первого порядка, а в некоторых случаях 
близкие к А-исчислению Чёрча. Представление знаний с помощью 
формул логических исчислений рассматривается в четвертой главе. 

Фреймы и семантические сети. Сейчас этот механизм 
используется сравнительно редко, хотя в недавнем прошлом это было 
не так. С математической точки зрения такие системы используют 
аппарат теории графов. 

Все три распространенных механизма сопоставимы с точки 
зрения выразительной силы и других общематематических свойств. 
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Предпочтение тому или иному механизму представления знаний 
часто отдается исходя из соображений привычности, удобства 
программирования, знакомства с теорией разработчиков прикладной 
системы. Особенно важным является то, насколько компактным 


оказывается представление знаний о конкретной задаче, см. параграф 
0. 


Знания Механизмы представления 


Фактографические Системы управления базами 
Е данных (СУБД) 
С. Алгоритмические + Библиотеки процедур 


ПЕЕ] Правила, или продукции 


Формулы логических 
Концептаульные Б 
исчислений 


Фреймы и семантические 


сети 


Рис Ошибка! Текст указанного стиля в документе 
отсутствует..12. Механизмы представления различных видов знаний 


1.4.4. Классификация по виду ответа при решении задач 


Решая конкретную задачу, прикладная система ИИ получает на 
входе знания в той или иной форме, а на выходе выдает ответ, 
который также имеет некоторую форму и представляет собой 
некоторое (новое) знание В соответствии с введенной 
классификацией видов знаний искусственно-интеллектуальные 
системы можно классифицировать по уровню выдаваемого ответа. 

0. Логический ответ (да или нет); не очень удобны в 
использовании, сейчас применяются редко. 

1. Фактографический ответ (ответ-факт); если выдается 
конкретный ответ на один вопрос, то такие системы часто называют 
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информационными системами. В настоящее время наиболее 
распространенный класс систем. 

2. Процедурный ответ; решая задачу, система может создать и 
запустить процедуру (система синтеза программ, автоматическое 
программирование). Очень интересное и перспективное направление, 
привлекающее внимание большого числа исследователей. 

3. Понятийный ответ; ответ-закон, строится не решение, а 
схема решения класса задач, может быть даже на компьютере не 
выполнимая. В настоящее время полномасштабные реализации пока 
неизвестны. 

Приведем примеры ответов разных уровней, используя 
модельный пример с сортировкой чисел из параграфа 0 (напомним, 
задача состоит в следующем: мы хотим, чтобы компьютер 
отсортировал набор из трех чисел в порядке их возрастания). 

(0)257 - да 

527 Э нет 

ея 

Оуу к ук ООЕЕ- 

(3) {х:) отсортировать > УП 1, /(1</ х; <х;) 


На уровне 0 мы предъявляем последовательность, а система 
только проверяет, отсортирована она или нет. На уровне | мы 
предъявляем последовательность, и система ее послушно сортирует. 
На уровне 2 система строит процедуру сортировки, примерно так, как 
это показано в параграфе 0. Наконец, на уровне 3 гипотетическая 
система объясняет нам, что это значит — отсортировать массив 


24 
чисел . 


7 В настоящее время программной системы, которая могла бы дать 
ответ на вопрос, «что значит отсортировать массив?», видимо, не 
существует. Однако, как велика доля людей, которые могут дать ответ на 
этот вопрос, не прибегая к помощи жестов и примеров? 


70 


1.4.5. Классификация по степени универсальности 


Вначале каждая новая идея представления знаний рождается, 
будучи привязанной к конкретной предметной области. Дело в том, 
что в области ИИ принято публикацию новых идей сопровождать 
хотя бы одним конкретным практическим примером, 
демонстрирующим преимущества новинки. Если идея хороша, она 
находит новые применения в смежных областях, вырастая в 
проблемно-ориентированный метод. В дальнейшем возникает соблазн 
сделать систему представления знаний как можно более 
универсальной для решения самых разнообразных задач. Однако это 
стремление практически бесполезно, поскольку с ростом 
универсальности резко падает применимость таких представлений 
знаний. 

Более точно поясним используемую нами терминологию”. 

Универсальность (данной системы представления знаний в 
данной предметной области) — доля задач предметной области, 
которые можно представить. 

Таким образом, мы называем универсальным (в данной 
предметной области) такой способ представления знаний, который 
позволяет сформулировать все задачи. 

Применимость (данной системы представления знаний в 
данной предметной области)— доля представимых задач 
предметной области, которые удается решить. 

Таким образом, мы называем всюду применимым, или 
тотальным (в данной предметной области) такой способ 
представления знаний, который позволяет решить все задачи с 
учетом реальных количественных ограничений. Понятно, что для 
достаточно широких предметных областей универсальные и 
одновременно тотальные системы представления знаний вряд ли 
возможны. Более того, наблюдения показывают, что между 


2 - 
° Эта терминология не является пока общепринятой, это наше 
предложение. 
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универсальностью и применимостью имеет место обратная 
зависимость (Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..13)”. 

Концепция представления мира дискретными состояниями и 
поиска последовательности преобразований из исходного состояния в 
целевое удивительно широко применима. Алгоритм поиска на графе 
применим во всех случаях. Однако за эту универсальность 
приходится платить сугубой неэффективностью поиска. 


80% 


60% 


Универсальность 


40% 


20% 


0% 
10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 


Применимость 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..13. Зависимость между универсальностью и применимостью 

Заметим, что на практике ни в базах данных, ни в пакетах 
прикладных программ, ни в прикладных системах искусственного 
интеллекта, как правило, не ставится цель достижения 
универсальности. Обычно ставится цель увеличения применимости, 
даже ценой снижения универсальности. Причины достаточно просты. 
Во-первых, от предметной области зависят способы манипулирования 
знаниями, и только учитывая особенности предметной области можно 


26 Б 

Мы изобразили график обратно-пропорциональной зависимости, в 
качестве примера, поясняющего качественную картину. Его нельзя 
использовать для количественных оценок. 
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надеяться построить компактное представление знаний, которое даст 
эффективное решение задач и повышает применимость. Во-вторых, в 
универсальных системах слабы метазнания (стратегия управления), 
т.е. знания о том, в каком порядке целесообразно применять 
конкретные правила, что важно, а на что можно не обращать 
внимание, решая задачу. 


1.4.6. Классификация по архитектуре и инструментальным 
средствам 


При анализе архитектуры прикладных систем с элементами 
искусственного интеллекта логично выделить: 

- объекты, с которыми манипулирует система (другими 
словами, что дано); 

- действия, посредством которых эти манипуляции 
производятся (что можно сделать с этими данными); 

- стратегию управления, которая определяет когда и какие 
манипуляции следует производить (в каком порядке, к каким 
объектам, какие действия нужно применять). 

Такое представление об — архитектуре искусственно- 
интеллектуальной системы не догма — оно возникает при анализе 
типичных современных систем искусственного интеллекта. Узко 
специализированные системы иногда имеет другую архитектуру. 
Имеется виду логический анализ, а не анализ на уровне машинных 
кодов, где архитектурная структура уже неразличима. 

Сейчас про эти три компонента (особенно, если они четко 
разделены в программной реализации) говорят: данные (свойства 
объектов), алгоритмы (методы объектов в терминах объектно- 
ориентированного программирования) и метазнания. 

Уже первые работы в области ИИ выявили потребность в 
специальных инструментальных средствах для разработки 
прикладных систем. Это связано с целым рядом особенностей 
программной реализации искусственно-интеллектуальных систем, 
часть их которых мы обсуждаем в третьей главе. Как бы то ни было, 
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для разработки прикладных систем искусственного интеллекта 
применялись и применяются разные языки программирования и 
инструментальные средства и это не может не накладывать отпечаток 
на конкретную систему. Использованное при разработке системы ИИ 


инструментальное средство является классификационным признаком. 


ВЫВОДЫ ПО ГЛАВЕ 1 


1. Искусственный интеллект является научным направлением, 
имеющим явно выделенный предмет — моделирование мышления, 
понимаемого как рациональное поведение, использующее целый ряд 
методов информатики и математики. 

2. История развития искусственного интеллекта 
свидетельствует, что период становления нового направления 
завершен и в настоящее время имеет место период практического 
применения. 

3. Анализ достижений искусственного интеллекта показывает, 
что наиболее существенными для практического применения 


являются методы представления знаний. 


ГЛАВА 2. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ 
СИСТЕМАМИ ПРОДУКЦИЙ 


Представление знаний системами продукций (РгодисНоп Киеѕ 
КпомІейаре Кергеѕепіайоп) является одним из наиболее часто 
используемых механизмов представления знаний в интеллектуальных 
системах. Этот механизм концептуально прост, его идея естественно 
воспринимается и легко реализуется программно. 

На самом деле, нет резкой границы между прикладными 
системами с искусственным интеллектом и другим программным 
обеспечением. Системы продукций — это просто еще один способ 
организации выполнения компьютером некоторого процесса 
обработки информации. Этот способ совершенно не похож на 
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привычное процедурное и объектно-ориентированное 
программирование, но обладает не меньшими возможностями. 


2.1. СИСТЕМЫ ПРОДУКЦИЙ 


Можно предложить несколько определений систем продукций 
(или продукционных систем, или систем, основанных на правилах)”, 
рассматривая их с различных точек зрения. В конечном счете, 
различные определения ведут к одному и тому же объекту, хотя и 
подходят с разных сторон и различаются в некоторых деталях. Мы 
рассмотрим три определения: 

- системы продукций с точки зрения их структуры; 

- системы продукций с алгоритмической точки зрения; 

- системы продукций как логические исчисления. 

Прежде чем переходить к систематическому изложению 
приемов и методов работы с продукциями как с информационными 
единицами, мы считаем необходимым навести некоторый порядок в 
сопутствующей терминологии, систематизировать разнообразные 
интерпретации и явным образом «расставить по местам» возможные 


области применения. 


2.1.1. Терминологические соглашения и содержательная 
интерпретация 


В названии параграфа присутствует слово «содержательная», 
которое обозначает сознательное отступление автора с позиций 
«строгости» и «алгоритмичности» в представлении материала, но это 


27 Не только в русском языке системы продукций обозначаются 
многими, почти синонимичными, но все-таки различными способами. В 
английском языке также применяют множество различных, хотя и 
похожих словосочетаний. Например, в выражении «[ргодисНоп] [ге] 
[Базе4] [ПпЁегепсе] ѕуѕіетѕ» почти любая пара или даже тройка слов, 
стоящих в квадратных скобках, может быть допустимым термином, 
имеющим прямое отношение к системам продукций. Поэтому при поиске 
информации на эту тему в Интернете мы рекомендуем провести поиск по 
нескольким различным словосочетаниям. 
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отступление временное — в пределах данного параграфа. 
Объясняется отступление желанием авторов подчеркнуть 
существующую в обсуждаемой области «неразбериху» в терминах, 
представлениях и обоснованиях, что, в свою очередь, является почти 
необходимым признаком «молодости» направления исследований и 
интенсивности его развития. 

Содержательно (с позиций здравого смысла и естественного 
языка) с термином «продукция» чаще всего ассоциируют 
сложноподчиненное предложение условного вида «Если посылка, то 
заключение». Не вдаваясь в детали, зафиксируем пока именно эти 
термины: посылка и заключение. Опять же, без дополнительных 
уточнений, для удобства изложения будем записывать продукцию в 
символической форме 

р 9, (®) 
где р и 4 представляют посылку и заключение, соответственно. 
Обращаем внимание читателя на то, что в символической записи, в 
отличие от словесного примера, явно зафиксирован третий и очень 
важный элемент продукции — связка, обозначенная стрелочкой. 
Каждый из трех элементов продукции может и должен иметь 
некоторую смысловую нагрузку (интерпретацию, семантику, 
означенность и т.д. — в разных литературных источниках 
используются различные варианты) для того, чтобы смысл можно 
было сопоставить всей продукции и соответствующим образом 
использовать её (продукцию) при решении конкретной проблемы. В 
зависимости от комбинации выбранных в каждом конкретном случае 
интерпретаций, может существенно изменяться применимый 
математический базис, а также алгоритмы и стратегии работы с 
продукциями. В то же время внимательный и дотошный читатель 
должен заметить, что вне зависимости от принимаемых 
интерпретаций любая продукция определяет некоторое правило 
поведенческого или преобразующего характера в конкретной 
предметной области. 
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Несмотря на заявленную в этом параграфе «содержательность», 
мы не станем анализировать всех возможных комбинаций 
семантических нагрузок, а ограничимся рамками тематики, 
определённой названием и назначением книги. 

Продукции естественным образом можно разбить на два 
непересекающихся класса: однородные и неоднородные. Это 
разбиение определяется способом задания интерпретации посылки и 
заключения продукции. В первом случае р и 4 получают «схожий» 
смысл (слова в некотором общем алфавите, числовые значения, 
логические выражения и т.д.). Ко второму виду мы отнесем 
продукции, в которых посылка и заключение интерпретируются по 
разному (условие — действие, состояние среды -— переход, стимул -— 
реакция, другие сочетания). 

Напомним еще один важный момент — все механизмы и 
приемы, составляющие содержание этой книги, предназначены для 
описания и анализа изменений в некоторой конкретной предметной 
области. Фиксированную ситуацию в предметной области мы, как 
правило, называем текущим состоянием (окружения или 
окружающей среды). Множество всех возможных состояний мы 
всегда (если явно не оговаривается иное) будем обозначать буквой Р, 
а отдельные состояния из этого множества будем обозначать буквами 
а с индексами и полагать, что это состояние описывается набором 
конкретных значений (утверждений) чего-либо (о чем-либо). Способ 
хранения (организации) текущего состояния 4 не принципиален 
(список, массив, набор таблиц). Механизм хранения текущего 
состояния мы также обозначаем буквой Р (всегда легко отличить по 
контексту о чем речь — о множестве состояний или о механизме 
представления множества в программе) и называем «база фактов» 
(реже — «база данных», а иногда «пространство поиска»). 

Множество всех возможных состояний базы данных Р 
называется пространством поиска (5еагсй ѕрасе). 
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Отражая динамику развития (изменения ситуации) 
анализируемой области, мы также можем говорить о переходе из 
одного состояния в другое, при этом мы предполагаем наличие 
начального (обязательно!) и конечного (не всегда) состояний. 
Последовательность переходов, ведущих из начального состояния в 
конечное состояние, мы называем выводом в пространстве поиска, а 
акт перехода из одного состояния в непосредственно вытекающее — 
шагом вывода. 

В Таблица 1 мы приводим типичные примеры систем 
однородных и неоднородных продукций, указывая предметную 
область, формальную теорию, выступающую теоретическим базисом, 
расшифровывая формулу (*), а также, фиксируя цель и (при наличии) 
возникающие проблемы. Кое-где мы приводим ссылки на достойные 


с нашей точки зрения источники (в том числе, на параграфы данной 


КНИГИ). 


Таблица 2. Примеры систем продукций 


Предметная Математический базис и Тип и формат 
область и ссылка цель продукции 

Синтаксический Нормальные алгорифмы Однородная, 

анализ [5] Маркова, цепочка > цепочка 
автомат-распознаватель 

Компьютерная Системы подстановок Однородная 

алгебра термов, терм —> терм 
редукция выражений 

Вычислительные Интуиционистское Однородная, 

модели исчисление высказываний, | аргументы > 
программа результаты 

Системы Исчисление предикатов Однородная, 

логического вывода | первого порядка, предикаты — 

[6] доказательство теоремы предикаты 

Экспертные Нет базиса, Неоднородная, 

системы (параграф | диагноз симптомы -—> диагноз 

1.1.3) 

Системы Нет базиса, гомеостаз или Неоднородная, 

управления иная цель управления состояние+стимул — 
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реакция 


Вопрос-ответные Нет базиса, поддержка Неоднородная, 
системы, (параграф | диалога вопрос+шаблон > 
1.1.2) ответ 


Мы видим, что для неоднородных систем нет общепринятого 
математического базиса. В лучшем случае, обоснованием систем 
второго класса могут выступить охраняемые команды Дейкстры [7], 
которые, впрочем, так и не стали строгой формальной теорией. 


2.1.2. Структура системы неоднородных продукций 


Генезис систем продукций. Как мы уже отмечали ранее, все 
(или почти все) прикладные системы с элементами ИИ, в той или 
иной степени, отражают (моделируют) некоторые аспекты 
человеческого мышления. Системы продукций не являются в этом 
отношении исключением. Первоначально подход использовался при 
построении так называемых экспертных систем (см. параграф 1.1.3), 
имитирующих поведение эксперта в некоторой предметной области 
при разрешении разного рода ситуаций, будь то установление 
диагноза пациенту, выработка заключения о целесообразности 
разработки месторождения полезных ископаемых (на основании 
данных геологоразведки) или что-то иное. Человек, как правило, 
решая подобные задачи, выстраивает цепочки  силлогизмов”. 
Подобный стиль мышления в быту часто называют дедуктивным, 
именно им блестяще владел и плодотворно его использовал один из 
самых великих литературных сыщиков — эксперт в области 
раскрытия преступлений Шерлок Холмс. 

Оговорка «в быту» сделана не случайно — мы хотели 
подчеркнуть элементы субъективности экспертного заключения, 
получаемого человеком. Эта субъективность обуславливается 
множеством факторов: 


2 

$ Силлогизм — умозаключение, в котором на основании нескольких 
суждений с необходимостью выводится новое суждение, называемое 
заключением [8]. 
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- полнотой и подробностью анамнеза” (используя медицинскую 
терминологию) — кашель курильщика может вызывать подозрение 
онколога, а у некурящего спортсмена, скорее всего, банальное ОРЗ; 

- опытностью эксперта — некоторые знают, что чайки, мирно 
гуляющие по берегу, предвещают шторм, другим неизвестно даже, 
что те же чайки, плавающие в море, гарантируют тихую и спокойную 
погоду; 

- умением применить знания в наиболее подходящем порядке 
(использовать наилучшую стратегию вывода!) и т.д. 

Вывод часто бывает не категоричным (неоднозначным) — 
«Пациент скорее жив, чем мёртв» (медицинский анекдот, а может и 
не анекдот). Нередко случается, что два разных эксперта из одних и 
тех же посылок строят различные (порой, противоречащие один 
другому) выводы — см. пример «ортогональной интерпретации» о 
болгарине и его девушке (параграф 1.1.1). 

Все эти черты, в той или иной степени, присущи современным 
компьютерным экспертным системам, использующим механизм 
продукций в реализации. 

С формальных позиций система неоднородных продукций 
является эклектичным объединением аппаратов нескольких 
независимых математических дисциплин; логики предикатов, теории 
вероятностей, теории графов, возможно, теории меры и чего-то еще... 
Аксиоматика большинства систем продукций (в части, отражающей 
конкретную предметную область — см. выше примеры про болгарина 
и чаек) может быть противоречивой, построенные заключения — 
недостоверными, а стоимость вывода — неоправданно высокой. Тем 
не менее (и это, порой, вызывает восхищение!) современные 
экспертные системы способны не просто облегчать жизнь медикам, 


2 Анамнез — описание прошлой жизни больного и история его 
болезни с самого начала ее, притом как внешних (объективных) 
проявлений ее, так и всех ненормальных ощущений, которыми она 
сопровождалась [8]. 
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геологам, химикам и специалистам других областей, но могут и 
«выдавать» абсолютно неожиданные и чрезвычайно продуктивные 
решения. 

Следует также отметить, что в настоящее время ведутся 
интенсивные исследования по усовершенствованию механизмов 
представления и обработки знаний для систем продукций. В 
частности, в качестве логического аппарата (и примкнувшей к нему 
теории вероятностей) предлагается использовать так называемые 
модальные логики, явно включающие в себя кванторы возможности, 
достоверности и персонификации знания, а также реализующие 
свойство немонотонности вывода и семантику возможных миров (см. 
[9, 10]. 

Система продукций (СП) определяется четвёркой: база 
фактов, множество продукции, система управления, условие 
окончания построения экспертного заключения. 

В этой книге база данных систематически обозначается буквой 
О, множество продукций — ЁК, стратегия (система) управления — С, а 
условие окончания — После того, как мы зафиксировали 
обозначения, приведенное выше определение может быть переписано 
в стандартной математической форме: 

СП = <р, В, С,і>. (0) 

Условие окончания может быть не задано, поэтому ниже мы 
приведем некоторый уточняющий комментарий к последнему 
элементу четвёрки. 

Таким образом, мы видим, что прикладные системы с 
элементами искусственного интеллекта, основанные на формализме 
продукций, имеют четкое деление на три части, упомянутые в 
предыдущей главе (см. параграф 1.3.4): 

- фактографическое знание (база фактов, как правило, 
реализованная в форме базы данных); 

- алгоритмическое знание (правила); 

- концептуальное знание (стратегия управления). 
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Именно поэтому системы продукций так хорошо отражают 
прикладные системы ИИ в целом. Рассмотрим элементы системы 
продукций более детально. 

Множество продукций К. Элементы этого множества обычно 
называют иродукционными правилами, или правилами продукции или 
просто продукциями. 

Неоднородная продукция (рто4испоп) — это пара «условие – 
действие», которая фиксирует порцию знаний, необходимых для 
выполнения одного шага построения экспертного заключения. 

Правило продукции может быть записано в виде: 

Г =де; р (4) Љћер а := Г (а) епа И, С) 
где р — условие, а } — действие. 

Тогда множество правил будет иметь вид: 

В= {| "= (р, ж) }. 

Условная часть правила р определяет, когда это правило может 
быть применено в зависимости от состояния окружения (базы 
фактов). Реализация р, как правило, определяется истинностью или 
ложностью предиката над множеством достоверно установленных к 
данному моменту фактов. Часть продукции | задаёт отображение 
7:0 0 и определяет действие над окружением”. Иногда 
используют вещественное число у’, которое характеризует цену (или 
вес, — тей!) применения правила. В таком случае можно, например, 
ставить задачу не просто найти какую-то последовательность 
применения продукций, ведущую к цели, а найти 
последовательность с минимальной суммарной ценой. 

База фактов Р содержит описание текущего состояния «мира» 
в процессе рассуждений. Это описание является образцом, который 
сопоставляется с условной частью продукции с целью выбора 
соответствующих действий при решении задачи. Если текущее 
содержимое базы данных удовлетворяет условию некоторого 


30 2, 
В некоторых особо экзотических системах продукций / может 
также влиять на способ выбора и применения последующих продукций. 
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правила, то может выполняться действие, указанное в этом правиле. В 
таком случае говорят, что правило применимо. Но возможность 
применить правило еще не означает необходимость его применять. 
Будет ли применимое правило действительно применено, определяет 
стратегия управления. 

Если правило применимо, и стратегия управления его выбирает, 
то правило применяется. После применения правила база данных 
меняет свое состояние. 

Стратегия управления С. Управляющая структура 
продукционной системы проста: база фактов инициализируется 
начальным описанием задачи. Текущее состояние решения задачи 
также отражается в базе фактов. Текущее содержимое базы фактов 
сопоставляется с условиями продукционных правил, что порождает 
подмножество применимых правил, иногда называемое 
конфликтным множеством. Далее выбирается одна из продукций 
ГЕЙ конфликтного множества (выполняется разрешение конфликта) и 
выполняется действие } этого правила. В результате применения 
правила меняется не только состояние базы фактов, но и, возможно, 
меняется конфликтное множество. Дело в том, что после изменения 
состояния базы условия некоторых правил могут перестать 
выполняться и эти правила нужно исключить из конфликтного 
множества. С другой стороны, условия ранее не включенных правил 
могут стать истинными, и их необходимо включить. При этом 
стратегии разрешения конфликтов (стратегии управления) могут 
быть как достаточно простыми, например, выбор первого 
применимого правила, так и достаточно сложными, например, 


\' Условия продукционных правил вовсе не обязаны образовывать 
полную дизъюнктную систему предикатов в общем случае. Вполне может 
случиться так, что сразу несколько правил являются применимыми — в 
этом случае они конфликтуют друг с другом. С другой стороны, может 
статься, что ни одно правило не окажется применимым в некоторой 
ситуации — это означает, что система продукций не может продолжить 
работу и останавливается с результатом #а11 - неудача. 
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использующими сложные эвристики. Правила применяются в 
соответствии со стратегией управления, например, до тех пор, пока 
либо не будет достигнуто условие окончания, либо уже не окажется 
больше применимых правил. 

Условие окончания Е. Обычно существует условие окончания 
процесса поиска решения ѓ : Р-Эђооі, то есть предикат, аргументом 
которого являются факты из базы данных. Если условие Ка) 
выполнено, то считается, что больше применять продукции не нужно, 
и текущее состояние базы данных 4 является ответом. Иногда условие 
окончания задается не в виде формулы, а сразу в виде множества 
состояний базы данных, удовлетворяющих условию окончания. В 
таком случае это множество обычно обозначается Т: 

Т = { 4єр | Ка) }. 

Возможен случай, когда условие окончания не задается, потому 
что система должна работать постоянно. Таковыми, например, 
являются системы автоматического управления технологическими 
объектами и процессами непрерывного действия. Здесь имеет смысл 
разместить обещанное выше разъяснение относительно последнего 
элемента четверки в формуле (**). Последний элемент — то самое 
обсуждаемое условие окончания # — мы из записи удалить не можем 
(в силу существующих математических «условностей»), поэтому 
договоримся считать, что для обсуждаемых в этом абзаце систем 
продукций постоянного действия мы просто будем полагать # 
тождественно равным ѓа1ѕе. 

Обсудив составные части систем продукций, обратимся к 
структуре системы продукций в целом. Организация прикладной 
системы ИИ в виде системы продукций обладает одним очень 
важным преимуществом — модульностью или алгоритмичностью 
знания. Отличие системы продукций от иерархически 
организованных программ заключается в следующем. 
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1. Между правилами нет прямой связи по управлению. 
Иными словами, правила не вызывают друг друга. Все управление 
правилами вынесено в стратегию управления С. 

2. Между правилами нет и прямой связи по данным. Правила 
ничего не сообщают друг другу, все данные находятся в базе данных 
р. 

Отсюда следует важный вывод — правила являются 
функционально и информационно прочными модулями. 

В прикладной системе с элементами искусственного интеллекта 
модульность критична, так как для таких программ очень часто 
заранее не ясен алгоритм действия. А значит, нужна 
модифицируемость, чтобы пробовать разные способы решения 
задачи. Именно этого можно достичь при использовании систем 
продукций, поскольку мы можем добавлять и удалять правила в 
множестве К, и это никак не скажется на других правилах! Более того, 
в пределе можно модифицировать множество А динамически, прямо в 
процессе решения задачи. 

Гленфорд Майерс рекомендует для использования при 
разработке программного обеспечения только два высших по 
прочности класса модулей. 

Функционально прочный модуль — это модуль, выполняющий 
(реализующий) только одну какую-либо определенную функцию. 

При реализации этой функции такой модуль может 
использовать и другие модули. 

Информационно прочный модуль — это модуль, выполняющий 
(реализующий) несколько операций над одной и той же структурой 
данных (информационным объектом), которая считается 
неизвестной вне этого модуля. 

Информационно прочный модуль может реализовывать, 
например, абстрактный тип данных или класс в объектно- 
ориентированном программировании. 
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Сцепление модуля — это мера его зависимости по данным от 
других модулей. 

Сцепление модулей характеризуется способом передачи 
данных. Чем слабее сцепление модуля с другими модулями, тем 
сильнее его независимость от других модулей. Для оценки степени 
сцепления Майерс предложил упорядоченный набор из нескольких 
видов сцепления модулей. Худшим видом сцепления модулей 
является сцепление по содержимому. Таким является сцепление двух 
модулей, когда один из них имеет прямые ссылки на содержимое 
другого модуля (например, на константу, содержащуюся в другом 
модуле). Такое сцепление модулей не рекомендуется использовать. 
Сцепление по общей области — это такое сцепление модулей, когда 
несколько модулей используют одну и ту же область памяти”. 
Наилучшим видом сцепления модулей, который рекомендуется для 
использования современной технологией программирования, 
является параметрическое сцепление — это случай, когда данные 
передаются модулю либо при обращении к нему как значения 
аргументов, либо как результат его обращения к другому модулю для 
вычисления некоторой функции. Такой вид сцепления модулей 
реализуется в языках программирования при использовании 


обращений к процедурам и функциям. 
2.1.3. Алгоритм работы системы неоднородных продукций 


Рассмотрим вид прикладной системы ИИ, выдающий 
простейший тип результата — только ответ да/нет (уровень 0, см. 
параграф 1.3.5.), что соответствует тому, выполнено условие 
окончания Ка) или нет. При этом мы считаем, что последовательность 
применения правил нам неинтересна. Положительный ответ «да» 
здесь и далее в программах обозначается ОК, отрицательный ответ 


«нет» — Ғаі1. В таком случае работа системы продукций задается 


2, о 
? Именно этот вид сцепления используется в системах продукции. 
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Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует.. 1. 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..1. Интерпретатор системы продукций. 
ргос Ргоаосііоп (а, В, +) 

мһі1іе — (а) ао 

г := бе1есЕ (а, В) 
ЇЁ г = 1011 ЕБеп гебагп (Ғаі1) епа 1Е 
Я := к.Е (а) 

епа мһі1е 

гееагп (ОК) 
епа ргос 

Этот алгоритм получает на вход начальное состояние базы а, 
множество продукций В и условие окончания +. Далее, пока не 
выполнено условие окончания, с помощью функции Ѕе1есі 
выбирается применимое правило и с его помощью меняется 
состояние базы данных пока не окажется выполненным условие 
окончания. Если применимого правила не находится, то процесс 
прерывается и выдается отрицательный ответ. 

Функция бе1есЕ — сердце этой системы, именно она 
определяет выбор применяемого правила, то есть стратегию системы 
продукций С. Как правило, в искусственно-интеллектуальной системе 
недостаточно информации для того, чтобы на каждом шаге применять 
наилучшее правило. Поэтому ироцесс выбора правила есть процесс 
поиска. 

Например, самая грубая стратегия поиска— «первый 
подходящий», представленная в Алгоритм Ошибка! Текст 
указанного стиля в документе отсутствует..2. Примеры более 
изощренных стратегий приведены далее. 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..2. Стратегия выбора правила «первый подходящий». 


ргос бе1есі (а, В) 
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Бог г є В ао 
1Е г.р (0) &Һеп гебакп (г) епа ій 
епа Ғог 
гебагп (п11) 
епа ргос 


Это хороший пример плохой стратегии. Трудно ожидать 
интеллекта от машины, если мы не закладываем в нее немного своего 
интеллекта. 

Рассмотрим более пристально систему продукций с 
алгоритмической точки зрения. Фактически, в Алгоритм Ошибка! 
Текст указанного стиля в документе отсутствует..1 мы определили 
и зафиксировали способ интерпретации знаний, представленных в 
форме множества продукций. Алгоритм Ошибка! Текст указанного 
стиля в документе отсутствует..|! носит чисто механический 
характер, в нем нет никаких признаков «интеллекта», ни 
искусственного, ни естественного, он просто исполняет множество 
правил № над входными данными 4, никак не анализируя ход 
изменения состояния базы, не оценивания, приближаемся ли мы к 
решению или удаляемся от него. Совершенно аналогично ведут себя 
и обычные компьютеры: они бездумно исполняют заложенную 
программу, не пытаясь понять, имеет ли какой-либо смысл их работа. 
Другими словами, Алгоритм Ошибка! Текст указанного стиля в 
документе отсутствует. является эмулятором виртуальной 
машины, а множество правил А — программа для этой машины. 
Особое место занимает функция Ѕе1есі. В этой функции и кроется 
«интеллект», то есть понятийные знания в терминологии параграфа 
1.3.2. Именно эта функция должна направить ход вычислений 
(преобразований базы) в сторону решения, в то время как 
алгоритмические знания, сосредоточенные в множестве правил К, 
живут каждое в отдельности и ни за что не отвечают. 
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2.1.4. Система продукций как логическое исчисление 


Само слово «продукция» в искусственный интеллект пришло из 
логики, причем не самым прямым путем. Продукция, или правило 
вывода — это логическое правило, которое утверждает, что если у нас 
есть посылки определенного вида, то из них следует заключение, 
также определенного вида. Например, правило Мо4ез ропепѕ 
утверждает, что если верны две посылки: утверждение А, и 
импликация, утверждающая, что из А следует В, то верно заключение 
В. В формульной записи такое правило записывают так: 

А, А В 
в: 

Так вот, с точки зрения математической логики, систему 
продукций можно рассматривать как формальную теорию (понятие 
формальной теории подробно раскрыто в параграфе 4.1.1). В этой 
формальной теории: 

- исходная база фактов — это часть набора аксиом (проблемно- 


ориентированных”) формальной теории вида | А(су,...,сь), где А — 


некоторый предикатный символ (обычно, сопоставленный свойству 
объектов рассматриваемой предметной области) — а все с; — 
константные термы; 

- продукции — это дополнение набора проблемно- 


ориентированных аксиом в импликативной форме вида - а & р(а) > 


М(Ка)), причем предикат р над набором фактов 4 — это своего рода 
«спусковой крючок» продукции, а запись М(Ка)) содержательно 
означает, что инициируется выполнение действий над базой фактов В 
(модификация базы), которые определяет функция /: О -> РБ, и 
успешное выполнение этих действий приписывает предикату МО 
значение @гие; 

- единственным правилом вывода выступает уже 


упоминавшиеся правило Моаеѕ ропепз; 


т.е. аксиом, связанных с рассматриваемой предметной областью. 


89 


- промежуточные состояния базы фактов — это наборы формул, 
полученные из проблемно-ориентированных аксиом в результате 
модификаций базы Р; 

- состояние базы данных, удовлетворяющее условию 
окончания — это целевая теорема, которую нужно доказать в данной 
формальной теории. 

Таким образом, решение некоторой задачи с помощью системы 
продукций можно трактовать как поиск доказательства 
соответствующей теоремы в специальной формальной теории. Данная 
интерпретация систем продукций еще раз подтверждает наблюдение, 
сделанное в главе 1 (см. параграф 1.1.5), о том, что подавляющее 
большинство задач ИИ можно трактовать как задачи 
автоматического доказательства теорем. 

Всё это было бы хорошо, если бы не одно «но»! Без таких «но» 
не обходится, практически, ни один результат в области ИИ даже с 
учетом сделанных нами во Введении и первой главе ограничений. 
Перечисленные в параграфе 0 неоднородные системы продукций, 
помимо указанных там недостатков, доставляют разработчикам и 
пользователям дополнительную (и немалую!) головную боль, и 
связано это как с неоднородностью, так и с предметными областями, 
для которых они разрабатываются. Дело в том, что в конкретной 
ситуации и факты верны не абсолютно, и применение того или иного 
правила оправдано лишь частично. Сошлемся на ту же медицинскую 
диагностику“. Как вы думаете, можно ли на основании наблюдаемого 
покраснения радужной и небольшого повышения температуры со 
стопроцентной уверенностью заявить, что пациент страдает, 
например, блефаритом? — Разумеется, нет! Такое заключение можно 
допустить лишь с некоторой вероятностью (в системах продукций для 
этого используют термины «коэффициент достоверности», 
«обоснованность», «индекс уверенности» и т.д., и обрабатываются 


34 
Как известно, в медицине разбираются все, так же как в проблемах 
образования и воспитания. 
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эти коэффициенты, порой, самым невероятным способом). Скажем 
больше, — обоснованность применения конкретной продукции к 
текущему состоянию окружения также является не абсолютной. 

Поясним на более формальном уровне применение одной из 
популярных в настоящее время техник работы с частично 
достоверной информации. Пусть Окал),..., О, (а,) — факты из 
конкретного 4 є Р, ү;, і=1,...,п — значения признаков обоснованности 
этих фактов из диапазона (0,1), а у. из того же диапазона — 
обоснованность (применения!) продукции г вида  (***). 
Модифицирующая составляющая продукции ғ. в реальных системах 
определяется в общем случае некоторой функцией, которая, 
естественно, имеет аргументы (пусть это будут факты О;(а;), 1=1,...,п) 
и результат (допустим, О%(4)). Проблема заключается определении 
достоверности модифицированного факта Ор — величины уд. 
Обращаем внимание читателя на использование слова 
«модифицированного» — г, может не только добавлять/удалять факт, 
но может и повышать/понижать уровень достоверности уже 
имеющегося! В случае удаления факта из базы вопросов не возникает. 
Обсуждая собственно модификацию, предыдущее значение 
обоснованности факта Оо мы будем обозначать символом уоорғел). 

Чаще всего для определения новых значений достоверностей 
используют те или иные комбинации минимаксных и вероятностных 
оценок. Первое (и, пожалуй, наихудшее), что может прийти в голову, 
является назначение новому (добавленному) факту признака 
обоснованности как минимума (реже, максимума) 
уе=МІМ(у},у2,...„уь, у), достоверность модифицированного факта при 
этом подходе вычисляют по формуле: уо=(уофға+МІМ(у, у...» у,))/2. 

Более привлекательным выглядит использование 
вероятностного аппарата, при этом обоснованность нового факта 
может определяться, как условная вероятность у. =Р( (ув, у2,...,у)|у,) = 
у, (1—0 (у, 2,...,уһ)), где = — любая более или менее разумная 
функция, не выводящая за пределы диапазона (0,1), это может быть 
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МІМ или МАХ, среднее арифметическое, взвешенное среднее” ИЛИ 
еще более экзотические варианты. Столь же разнообразны и методы 
определения достоверность модифицированного факта. Отметим 
весьма важное обстоятельство — мы не можем говорить о 
достоверности некоторого состояния базы фактов целиком 
(интегрально) — это все равно, что подсчитывать «среднюю 
температуру по больнице». 

В последние годы разработчики все чаще ищут более строгий (и 
целостный) формальный базис для работы с неоднородными 
продукциями. Известны попытки использовать нечеткие логики [11], 
дескриптивные логики [12] и другие теории. 

Похвальное стремление разработчиков прикладных систем 
продукций, практически, полностью дезавуируется тем 
обстоятельством, что оценки достоверности исходных фактов и 
правил в конкретизированной предметной области сами не являются 
достоверными — их выставляют эксперты (люди с немалым опытом, 
но всё же люди!), которым, как известно «свойственно ошибаться». 
Какой бы не была продуманной и сбалансированной реализация 
системы с элементами ИИ и на какой бы сильный и строгий 
теоретический базис она не опиралась, но, если исходный материал 
не вполне достоверен и имеет оттенок субъективности, то 
найденное решение также будет носить характер возможного (но 
не абсолютного!). Этот тезис является, пожалуй, одним из самых 
важных в книге, и если читатель его усвоит, это поможет избежать в 
дальнейшем глубочайших разочарований и уверенно чувствовать 
себя в «бурлящих водах океана искусственного интеллекта»! 


35 
Взвешенное среднее определяется выражением вида: 


(САУС... +С, )/(с1+с2+...+с,), где с; — некоторым образом заданные 
(экспертом) константы, определяющие «степень влияния» отдельного 
аргумента на конечный результат. 
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2.1.5. Игра в восемь 


Эффективность искусственно-интеллектуальной системы 
определяется в первую очередь тем, насколько удачно выбрано 
представление знаний для всех компонентов Р, К, С. Здесь мы 
рассмотрим несколько примеров простых головоломок, акцентируя 
внимание на удачных и неудачных выборах представления знаний. 

Рассмотрим игру в восемь (пример взят из книги [13]), которая 
многим знакома по аналогии с известной игрой в пятнадцать. Суть 
игры заключается в перемещении фишек, пронумерованных от 1 до 8 
так, чтобы они расположились по возрастанию по часовой стрелке. 
При этом одна из клеток поля 3х3 всегда свободна, и на нее можно 
перемещать любую соседнюю фишку. Фишки не могут «прыгать» 
друг через друга— их можно только передвигать на соседнее 
свободное место. 

Допустим, у нас имеется следующие исходная (слева) и целевая 
(справа) позиции, представленные на Рис. Ошибка! Текст указанного 
стиля в документе отсутствует..14. 


2 8 З 1 2 З 
1 6 4 8 4 
у 5 7 6 5 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..14. Исходная и целевая позиции игры в восемь 

Представим знания об игре в восемь на основе систем 
продукций. 

Представление базы данных напрашивается из физического 
смысла. Обозначим пустую ячейку как фишку с номером 0. В 
результате О будет иметь вид: 
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р +. .аккау:, Пи ӨЕ 028 

Правила А тоже записываются достаточно ожидаемо. Например, 
правило «подвинуть фишку 1 вниз» имеет вид: 
1Е 0[1,35]=1 & 1<3 & 0[1+1,3]=0 ЕБер р[і+1,3]:=1; 
р[1,3]:=0 

Исходя из того, что любую из восьми фишек можно подвинуть 
максимум в четыре стороны, получается всего 32 правила. Это 
естественное, но не самое удачное представление знаний об игре. 

Попробуем усовершенствовать первоначальный вариант. 
Основная идея заключается в том, что любое перемещение фишки 
можно рассматривать как перемещение пустой ячейки. Вот здесь мы 
и закладываем немного своего интеллекта. 

Добавим в базу данных еще пару чисел {і, 3 } — координаты 
пустого места. Обозначим направления движения по сторонам 
света — север, запад, юг и восток. 


1Е 1>1 ЖҺеп р[і,3]:=р[1-1,39]; 1:=1-1 (1 М на север) 
1Е 5<3 ЕВеп 0[1,7]:=0[1,7+1]; 7:=7+1 (> Е навосток) 
1Е 1<3 ЕВеп р[і,ј]:=р[і+1,3]; 1:=1+1 (1 $ наюг) 

[ [ ( 


1Е )>1 +Веа 0[1,7)]:=0[1,)-1]; ):=-1 \ на запад) 

В результате составлено представление знаний для игры в 
восемь, в котором всего 4 правила вместо 32. Это принципиальный 
результат, потому что число правил и (4 или 32) является аргументом 
экспоненциальной функции перебора для поиска решения. Для п = 4 
мощности среднего компьютера наверняка хватит, чтобы быстро 
произвести полный перебор и найти решение, а для п = 32 может и не 


хватить. 
2.1.6. Крестьянин, волк, коза и капуста 


Второй пример — известная задача о крестьянине, которому 
необходимо перевезти на другой берег волка, козу и капусту так, 
чтобы они не съели друг друга (Рис. Ошибка! Текст указанного стиля 
в документе отсутствует..15). В лодку крестьянин может взять с собой 
не более одного объекта. 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..15. Крестьянин, волк, коза и капуста: постановка задачи 

Естественно, можно упростить данную задачу. Идея такова — 
крестьянин и лодка неразличимы, и составляют одно целое. Также 
можно считать любое перемещение с берега на берег мгновенным. 
Перенумеруем объекты: 0 — крестьянин, | — волк, 2 — коза, 3 — 
капуста. Присутствие объекта на правом (целевом) берегу обозначим 
«1», на левом (исходном) — «0». В таком случае, очевидно, что база 
данных О должна иметь вид 
р : агхау [0..3] о©Е 0..1 

При этом р[0] — это положение крестьянина, р [1] — волка, 
р[2] — козы и р[3] — капусты. Массив р мы будем записывать в 
виде четырехзначной битовой шкалы. Например, 0101 означает, что 
крестьянин с козой находятся на левом берегу, а волк с капустой — 
на правом. Тогда исходное состояние базы до = 0000, а целевое 
ае = 1111; 

Каково должно быть множество правил? Если подойти к 
решению этой задачи прямолинейно, в лоб, то можно рассуждать 
следующим образом. Всего имеется 16 возможных состояний базы”. 
Рассмотрим пары состояний базы, такие, что из первого состояние 
можно перейти во второе за один ход. Например, 1011—0011 — 
крестьянин переплыл с правого берега на левый. Таких пар 


4 
36 При п=4 имеется 2* = 16 различных битовых шкал. 
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оказывается, как нетрудно видеть, 16*4=64. Заметим, что некоторые 
состояния базы допустимы, например, 0101, а другие состояния 
недопустимы, например, 0011 — коза съест капусту. Легко 
проверить, что допустимых состояний 10, а недопустимых — 6. 
Отбросим те пары состояний, в которых целевое состояние является 
недопустимым. Оставшиеся пары, а их 40 штук, являются правилами 
нашей системы. 

Нетрудно видеть, что это чисто механическая, формальная 
работа, которую можно поручить компьютеру. Однако результат 
окажется не очень хорошим (четыре десятка правил). Такое 
представление знаний нельзя назвать удачным. 

Попробуем подойти к задаче творчески. В данном случае 
творчество состоит в привлечении общих знаний, которые в исходной 
постановке задачи не содержались. 

1. Если начальное состояние допустимо и все правила 
сохраняют допустимость, то любое достижимое состояние допустимо 
(принцип полной индукции). 

2. Для решения этой задачи достаточно рассматривать только 
допустимые состояния базы (недопустимые не могут войти в решение 
даже на промежуточных этапах). 

Заметим, что начальное состояние допустимо (так же, как и 
конечное). Осталось выделить правила, сохраняющие допустимость. 
Для этого заметим, что в задаче, по существу, есть всего четыре 
возможных хода: движение крестьянина без объекта, движение 
крестьянина с волком, с козой и с капустой. Теперь осталось 
выписать простые условия допустимости этих ходов и получить 


множество правил К: 


ТЕ [1 ]<>012] “912 1<>0[3] фреп 2:10] := № = рро] 

1Е р[2]<>0[3] & р[0]=0[1] фреп В аерге 
В 0 зА 

1Е р[0]=р[2] фреп р[0]:= 1 - 2[01; 
ев | 

іЁ 2[1]<>0[2] & р[0]=р[3] фреп р[0]:= 1 - 2[01; 
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0[3]:=1 = [3] 
Таким образом, в данном случае творческий подход к задаче 
улучшил представление знаний в десять раз. 


2.1.7. Ход конем 


В шахматах конь может перемещаться «буквой Г» — на два 
поля по горизонтали или вертикали и на одно поле в 
перпендикулярном направлении. При этом он не должен выходить за 
границы шахматной доски. Таким образом, в самом общем случае 
существуют не более восьми возможных ходов конем из данной 


позиции ( 

Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..16). Если конь находится на краю доски, возможных 
ходов меньше. 
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а р е а е Е Ч Һ 


Рис Ошибка! Текст указанного стиля в документе 
отсутствует..16. Возможные ходы конем 

Традиционная формулировка задачи заключается в том, чтобы 
найти такую последовательность ходов конем, начиная с 
произвольного поля, при которой конь становится на каждое поле 
доски только один раз. 

Тогда база данных Р будет иметь вид: 
Г» + акках 12.81.281] ФЕ 1..0; 

где р[і, 7] = 1 означает, что конь был на поле (1,7), а 
0 — не был.’ 

Тогда исходное состояние базы По — все элементы массива р 
нули, а целевое р, — все элементы Р единицы. 

Подсчитаем, сколько всего различных ходов конем существует в 
шахматах (на пустой доске). Для каждого из 16 полей в центре доски 
существует по 8 ходов. Для полей примыкающего слоя — по 6 ходов, 


°” Для упрощения обозначений при написании алгоритмов мы 
отходим от традиционной шахматной нотации, обозначая как горизонтали, 
так и вертикали цифрами, а при указании ходов в шахматном смысле 
используем привычные обозначения вертикалей латинскими буквами. 
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за исключением полей 02, Ь7, 22, ©7, в которых только по 4 хода. 
Далее, из полей на краю доски возможны по 4 хода, за исключением 
угловых полей, из которых существует только 2 хода, и полей а2, 1, 
а7, 68, 08, №7, №2, 01, из которых конь может прыгнуть на 3 других 
поля. Итого имеем: 16*8 + 16*6 + 4*4 + 16*4 + 8*3 +4*2 = 336 ходов 
конем. 

Очевидно, не имеет смысла нумеровать все реально возможные 
ходы и сопоставлять им правила: их слишком много. Заменим 
реальные ходы набором из восьми продукций, генерирующих 
допустимые ходы конем, руководствуясь 


а п с Я е Е ч Н 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..16. При этом мы можем прямо в правила внести проверку 
условия задачи о том, что конь может попадать на данное поле только 


один раз. Текущие координаты коня хранятся в переменных і и). 


Е і <= 6 & ј <= 7 & 0[1+2,ј+1] = 0 %һеп 
2[1+2, 3+1] = 1 & і = 1+2 & ј = 3+1 

Е і <= 7 & ј <= 6 & р[і+1,ј+2] = 0 еп 
2[1+1,3+2] = 1 & і = 1+1 & ј = 3+2 

Е і >= 1 6 ј <= 6&01[:-1,3+2] = 0 еп 


р[і-1,3+2] = 1 & і = і-1 & ј = 5+2 
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ТЕ і >= 2 & ӯ <= 7 & р[1і-2,3+1] = 0 Вер 
Ван = ма = 1-2 а = 

1Е і >= 2 & у >= 1 & р[1і-2,3-1] = 0 +Һеп 
рар = в едь рее тет 

1Е 1 >= 1 & у >= 2 & р[і-1,3-2] = 0 +Һеп 
р[1-1,3-2] = 1 & і = 1-1 & ј = ј-2 

1Е 1 <= 7 & 7 >= 2 & 0[1+1,3-2] = 0 еп 
рае] е 465 е ан с д раа 

1Е 1 <= 6 & ] >= 1 & р[і+2,3-1] = 0 +Һеп 
р[1+2,3]-1] = 1 & і = 1+2 & 5 =)-1 


Экономия по сравнению с «лобовым» подходом составляет 
336:8 = 42 раза. 


2.2. СТРАТЕГИИ УПРАВЛЕНИЯ 


Можно предложить огромное множество стратегий управления 
(сопѓгоЇ ѕігаѓеоіеѕ) для систем продукций. Самое важное наблюдение 
состоит в том, что не существует и не может существовать 
наилучшей стратегии управления на все случаи жизни. Одна и та же 
стратегия может хорошо работать для одного класса задач и быть 
совершенно неудовлетворительной для другого. 

Предваряя основной материал раздела, мы сделаем ряд 
замечаний. На первый взгляд эти замечания могут показаться 
несущественными, однако мы последовательно пытаемся 
придерживаться принципа необходимости (нужности, полезности) 
всего материала, включённого в книгу — это в равной мере касается 
примечаний, добавлений и шуток, встречающихся в тексте. 

Поговорим о естественности терминов, однозначности 
определений и единственности трактовок. Начнем, пожалуй, с 
графов, точнее, с класса, важного для понимания материала книги, 
называемого классом ориентированных деревьев. Зададимся 
вопросом, куда растет дерево — вверх или вниз? Разумеется, первым 
в голову приходит ответ «вверх», но так ли это очевидно и 
правильно? А что, если встать на голову (поменять систему 
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координат)? или вспомнить о корнях” (рассмотреть более полную 
картину)? Наконец, можно просто переопределить понятия верха и 
низа”, взаимно поменяв их смысл (исходя, скажем, из соображений 
удобства“? при изображении объекта заранее неизвестного размера). 

Примеров подобного толка существует огромное количество", и 
все они убеждают лишь в одном — направления (равно как и их 
именование) являются весьма относительными, и каждый раз, если 
это не следует из контекста, необходимо фиксировать систему 
отсчета. 

Вооружившись этими наблюдениями, вернемся к стратегиям 
управления выводом. Напомним, что речь идет о системах 
продукций, где базовым объектом выступает выражение вида (*). В 
записи продукции р -> 4 присутствует символ «->», который 
некоторым образом задаёт систему отчета: движение от аргументов к 
результатам (от данных к цели) осуществляется, как бы, в прямом 
направлении, а от цели к данным — соответственно, в обратном. 
Такая классификация стратегий характерна, в основном, для 
следующих областей искусственного интеллекта: экспертные 
системы, автоматический синтез программ, системы верификации и 
ряд других. В то же время в «более фундаментальной» области 


** Известно просто замечательное растение — баньян — индийский 
фикус, священное дерево буддистов. С его горизонтальных ветвей к земле 
опускаются отростки, которые превращаются в корни, разрастаются, 
приобретают колоннообразный вид, и одно дерево становится целой 
рощей. 


39 ' 


Символ "Ж' (‘живете’) древнерусского алфавита как раз и 
изображает дерево (Жизни — авт.), при этом он (символ) обладает как 
центральной, так и осевыми симметриями! 


4 
0 Имеется в виду «удобство» для тех, кто привык писать слева 
направо, а не, например, по-арабски. 
ЫЛ ЫЛ ЫЛ 


4! Вспомним противоположность направлений отчета угловых мер в 
геодезии и математике — «посолонь» и «противосолонь», и 
«естественность» этих направлений для жителей Северного и Южного 
полушарий. 
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автоматического доказательства теорем (её еще называют логическим 
программированием) принята прямо противоположная 
классификация: целеориентированные стратегии” (от целевой 
формулы к аксиомам) называют прямыми, а ведущие от аксиом к 
целевому утверждению — обратными. К последним относится 
чрезвычайно интересный и перспективный обратный метод, 
предложенный ленинградским логиком С.Ю. Масловым [16]. 

Таким образом, (с некоторыми допущениями, разумеется) 
можно считать, что обратный метод Маслова и прямая волна 
реализуют одну и ту же стратегию, несмотря на радикальное 
расхождение в названиях. 


2.2.1. Критерии сравнения стратегий 


Раз стратегии различны, нужны критерии для их сравнения. 
Критериев для сравнения также немало, и мы приведем здесь те, 
которые нам импонируют. 

Некоторые варианты стратегий управления приведены на Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..17. Здесь 
используются два критерия: 

- какая доля информации, уже полученной в ходе поиска 
решения, сохраняется для последующего использования; 

- до какой степени разрешены возвраты (перевод базы данных 
происходит не в новое, а в одно из старых состояний). 

Заметим, что на самом деле эти критерии не являются вполне 
независимыми. Действительно, чтобы вернуть базу в одно из уже 
пройденных состояний, нужно, по меньшей мере, сохранить 
информацию о пройденном состоянии. 


42 

Их предложили сначала М. Дэвис и Х. Патнем [14], а затем развил 

и усовершенствовал, разработав широко известный метод резолюции, Дж. 
Робинсон [15]. 
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А 


допускается любой 
-— возврат е 


Поиск на графе 


Возвраты 


Поиск с возвратами 


Первый 
подходящий сохраняется вся 
| информация 
| ра 


Сохранение информации 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..17. Варианты стратегии управления 

Очевидно, что стратегия «первый подходящий», приведенная 
ранее (см. параграф 0, алгоритм 2.2), простейшая и соответствует 
левому нижнему углу на плоскости стратегий на Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..17. Эта стратегия 
относится к группе стратегий безвозвратный поиск. 

Кроме безвозвратного поиска, в этой книге рассматриваются 
еще две популярные группы стратегий: 

1. Поиск на графе, при котором сохраняется вся доступная 
информация и возможны любые возвраты, хоть в начальное 
состояние. 

2. Поиск с возвратами — промежуточный вариант, когда 
некоторая информация сохраняется, но не вся, и используются 
возвраты, но не произвольные. 

Любую стратегию можно оценить по двум критериям — по 
затратам на выбор правил и по затратам на применение правил. При 
этом, естественно, возможно два крайних случая — тупая, но быстрая 
стратегия и умная, но медленная стратегия. Слишком быстрая 
стратегия не тратит много времени на выбор правил, а сразу бежит 


103 


вперед, применяя их. Но может быть, это бег в ложном направлении, 
который ведет к возрастанию затрат на бесцельное применение 
правил. Слишком умная стратегия семь раз отмеряет, прежде чем 
отрезать и применить правило. Может быть, это хорошее правило, 
прямо ведущее к цели, но каковы будут затраты на топтание на месте 
перед его выбором? Как всегда, есть и золотая середина, где общая 
трудоемкость процесса будет минимальной (Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..18). Дело в том, что в 
обоих случаях затраты растут не линейно, а более быстрым образом, 
то есть функции затрат выпуклы вниз, как показано на Рис. Ошибка! 
Текст указанного стиля в документе отсутствует..18, поэтому у суммы 
таких функций обязательно есть минимум. Всё искусство 
составления успешной стратегии состоит в том, чтобы отыскать 
этот минимум в каждом конкретном случае. 


—— Пробы 


—. Применение 


— Всего 


Общая трудоёмкость 
> 


тупо хорошо умно 
Количество проб 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..18. Составляющие затрат на применение стратегии 
управления 


2.2.2. Безвозвратный поиск 


Безвозвратный поиск, как следует из его названия, — это 
такой алгоритм поиска, когда мы не собираемся возвращаться к 
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предыдущим состояниям базы данных, а значит, можем не хранить 
информацию об этих состояниях. 

Простейшим случаем безвозвратного поиска является стратегия 
«первый подходящий», описанная выше, в параграфе 0. В этом случае 
поиск ведется вслепую, наудачу, и результат существенным образом 
зависит от того, в каком порядке перебираются (а значит, и 
применяются) правила при проверке. Если мы ничего не знаем о 
задаче, а пространство поиска велико, то не стоит рассчитывать на то, 
что стратегия «первый подходящий» даст хороший результат. 

Также как и в других случаях, в случае безвозвратного поиска 


можно ввести оценочную функцию Е : Ю > В, где В — множество 


неотрицательных вещественных чисел. Запись ЁЕ(а) — оценка 
состояния базы данных 4. Функция Е подбирается таким образом, 
чтобы на терминальных узлах (тех состояниях базы, где выполняется 
условие окончания) функция принимала минимальное значение 

а) =ау РА) = тіп { дер | Е@) }. 

В этом случае функция Ѕе1есі, реализующая стратегию 
«первый подходящий, уменьшающий оценку», может быть записана, 
как указано в Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..3. Ясно, что такая стратегия, по меньшей мере, не хуже 
стратегии «первый подходящий», а если оценочная функция 
подобрана удачно, то такая стратегия будет намного лучше. 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..3. Стратегия выбора правила «первый подходящий, 
уменьшающий оценку». 
ргос бе1есїі (а, В) 

Ғог г є В ао 


1Е г.р(а) & Е(г.Е(а)) < Е(а) +һеп 
гебагпр (г) 
епа і 


епа Ғог 
гебагп (п11) 
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епа ргос 

Можно улучшить процедуру, выбирая такое правило, которое не 
просто уменьшает оценку, а уменьшает ее в наибольшей степени. 
Такую стратегию часто называют методом наискорейшего спуска, 
или градиентным методом, который относится к классу жадных 
алгоритмов (отеейу ѕеагсһ). В Алгоритм Ошибка! Текст указанного 
стиля в документе отсутствует.4 представлена простейшая 
реализация метода наискорейшего спуска. 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..4. Стратегия выбора правила «наискорейший спуск». 
ргос бе1есі (а, В) 

ш := Е(а) 

т’ := 1011 

Ғог г є В ао 

ТЕ г.р. (94) & Е. Е(а) ) < м Ее 


’:= г 
п := Е(ї.Ё(а)) 
епа 1Е 


епа Ғог 

геёогп (г’) 
епа ргос 

Из вычислительной математики хорошо известно, у методов 
этого типа есть существенный недостаток — иногда в процессе 
поиска решения возможны попадания в локальные минимумы и 
плато, которые в общем случае достаточно трудно обнаружить, для 
этого требуются очень дорогие вычисления. Попав в локальный 
минимум, метод наискорейшего спуска остановится в нем, не найдя 
решения. Попав на плато, метод приведет к бесцельным случайным 
блужданиям по плато. 

Метод наискорейшего спуска хорошо работает, если оценочная 
функция унимодальна, то есть имеет единственный глобальный 
минимум и не имеет плато. Но чтобы подобрать унимодальную 
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оценочную функцию, нужно исчерпывающим образом знать свойства 
пространства поиска, а они, как правило, неизвестны. 

Рассмотрим пример. В случае игры в восемь возьмем 
оценочную функцию Е — это число шашек, находящихся не на своем 
месте. В результате граф поиска этой игры будет выглядеть 
следующим образом (Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..19). 


З 
Юю 


Рис Ошибка! Текст указанного стиля в документе 
отсутствует..19. Оценочная функция Е: число шашек не на своем месте 

Здесь узлы графа обозначают состояния базы данных, а числа в 
узлах — это значение оценочной функции в данном состоянии. 

В данном случае оценочная функция оказалась очень 
удачной — метод наискорейшего поиска быстро нашел решение. Но 
здесь есть элемент везения: из узла с оценкой 3 поиск пошел на север, 
а не на запад, просто потому, что правило движения на север в нашем 
списке правил оказалось раньше правила движения на запад. 


2.2.3. Поиск с возвратами 


Безвозвратный поиск подразумевает, что в случае применения 
неподходящего правила решение либо становится принципиально 
невозможным, либо процесс поиска значительно замедляется. Можно 
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положить в основу алгоритма поиска следующую идею: если в 
текущем состоянии базы данных видно, что при продолжении 
начатого решение либо невозможно найти, либо этот поиск обещает 
быть слишком долгим, тогда можно попробовать вернуться назад и 
попробовать другой путь. 

Стратегия поиска, в которой происходит возвращение назад и 
применяется другое правило, если применение правила оказывается 
неподходящим, называется поиск с возвратами? (Васкітаскіпа). 

Рассмотрим процедуру Васкігаскіпа (Алгоритм Ошибка! 
Текст указанного стиля в документе отсутствует..5). 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..5. Процедура поиска с возвратами для системы продукций. 
ргос Васкїігаскіпд (а, В, Ф) 

1Е ©(а) +һеп гебагп (ОК) епа 1Е 

1Е реадепа (а) ЕВеп гееагп (Ғаі1) епа 1Е 

В’ := ЗеіесіА11 (а, В) 

Ғог г є В’ ао 

1Е Васкігаскіпа (г.Е(а), В, +) = ОК +&Һеп 
гебагп (ОК) 
епа 1Е 

епа Ғог 

гебагп (Ғаі1) 
епа ргос 

Идея процедуры поиска с возвратами очень проста и состоит в 
следующем. Если достигнуто какое-то из условий окончания, то 
работу нужно прекратить и вернуть результат. В противном случае 
следует определить множество правил, применимых в данном 
состоянии (конфликтное множество, см. параграф 0) с помощью 
функции Ѕе1ес+А11. Далее следует в цикле по применимым 
правилам рекурсивно обратиться к той же процедуре поиска с 


4 9 

° Иногда применяют неудачный термин «обратное прослеживание». 
Этот термин является точным переводом с английского, но плохо отражает 
суть дела. 
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возвратами, но в качестве состояния базы данных использовать 
состояние, которое получается после применения выбранного 
правила. 

В данную процедуру целесообразно включить функцию 
Реадепа — обрыв «мертвых» путей (тупиков), иначе может 
произойти зацикливание программы. 

Процедура Рреадепа может проверять самые разные условия, 
например: 

- совпадение текущего состояния базы данных В с уже 
построенным ранее; 

- ограничение глубины поиска и т.д. 

Пример поиска с возвратами для задачи о волке, козе и капусте 
представлен на Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..20. На этом рисунке серым отмечены узлы, из которых 
происходит возврат, потому что они идентичны уже построенным 
узлам. Отдельно следует упомянуть узел 0001. Это тупиковый узел — 
продолжение поиска из него невозможно. К счастью, продолжение и 
не нужно, т.к. к этому моменту алгоритм находит целевой узел 1111. 
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1010 


1110 


Рис. Ошибка! Текст указанного стиля в документе 


отсутствует..20. Поиск возвратами для задачи о волке, козе и капусте 

Здесь в качестве функции ПеаЧепа используется проверка 
совпадения нового состояния базы с построенным ранее на этом пути. 

Известны различные модификации поиска с возвратами. 
Например, когда в процессе поиска сохраняются не все, а только 
ключевые состояния базы данных, и возврат выполняется не на один 
шаг, а на несколько шагов назад к последнему сохраненному 
состоянию. 

При поиске с возвратами происходит обход дерева, причем в 
памяти хранится не все дерево, а только текущий построенный путь в 
этом дереве. Движение вниз по дереву соответствуют рекурсивные 
вызовы. Движению вверх соответствуют возвраты. На Рис. Ошибка! 
Текст указанного стиля в документе отсутствует..21 представлен 
фрагмент дерева поиска с возвратами для задачи о ходе конем. 
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[а [=] [#5] “= 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..21. Фрагмент дерева поиска с возвратами для задачи о ходе 
конем 

Ставим коня на произвольное поле доски. В данном случае в 
качестве первого поля взято угловое поле а1. Поочередно переставляя 
коня на различные поля, ищем такое, на котором ранее конь не был. 
Если таких полей вообще нет, то возвращаемся на предыдущее поле и 
так далее. 

Заметим, что сама структура правил предполагает хранение 
информации о тех полях доски, на которых конь уже побывал (см. 
параграф 0). Поэтому здесь в функции Реааепа нет нужды 
проверять совпадение нового состояния базы с построенным ранее на 
этом пути. Ценой хранения некоторой дополнительной информации в 
базе данных, можно уменьшить вычислительную нагрузку на 
процедуру поиска с возвратами. 


2.2.4. Поиск на графе 


Поиск на графе (огарһ ѕеагсһ) относится к группе 
информированных стратегий, при которых хранится вся доступная 
полученная ранее информация. Для этого создается так называемый 
граф поиска. 
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Граф поиска — это ориентированный граф С (Т, Е), в котором 
множество узлов У — это совокупность“ состояний базы данных, а 
множество дуг Е — это совокупность применений правил. 

В этом графе есть начальный узел ф и множество (возможно, 
пустое) терминальных узлов Т = {4єр |((0)}. Элементы множества 
терминальных узлов будем обозначать 4,, 4,єТ. Дуга из узла д, в узел 
а проводится в том и только в том случае, когда существует правило, 
применимое в состоянии 4 и в результате своего применения 
переводящее базу в состояние 4. 

а > 4 Е Е < ЗгЕ;ЕВ ( г.р(а, & г. (а) = 4). 

В общем случае в графе поиска могут быть циклы, петли, 
мультидуги. Он может быть не связан и т.д. 

Для поиска на графе используются следующие две основные 
процедуры, приведенные в алгоритмах Алгоритм Ошибка! Текст 
указанного стиля в документе отсутствует..6 Алгоритм Ошибка! Текст 
указанного стиля в документе отсутствует..7: 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..6. Основная процедура поиска на графе. 


ргос Сгарһ5беагсһ (а, В, +) 


О := {а} { список «открытых» узлов } 
С := © { список «закрытых» узлов } 
мр11е — (а) ао 

Я := бе1Іесі (0) 


1Е а = п11 ЕБеп геіџгп (Ёа11) епа 1Е 
Ореп (а, В); 
епа мһі1Іе 
геёигп (ОК) 
епа ргос 


"Мы используем здесь термин «совокупность», чтобы подчернуть, 
что все узлы графа поиска индивидуальны и различны, но разные узлы 
графа могут соответствовать одному и тому же состоянию базы, 
аналогично, все дуги графа индивидуальны и различны, но разные дуги 
могут соответствовать применению одного правила. 
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Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..7. Процедура раскрытия узла. 
ргос Ореп (а, В) 
Ғог г є В а 
1Е г.р(а) ЕБеп 
1Е х.Е(а) Є О &г.Е(ПО) є С +Һеп 
ОЕ ела. (В 
епа 1Е 
епа 1Е 
епа Ғог 
О Ое В 
® В 
епа ргос 


Здесь знак + означает добавление элемента в список, а знак — 
означает удаление элемента из списка. 

Список О традиционно называется списком открытых узлов (от 
английского Ореп), а список С традиционно называется списком 
закрытых узлов (от английского С10$е). Между тем эти традиционные 
названия могут вводить в заблуждение. На самом деле список О — 
это список узлов, которые мы еще не открывали, но собираемся 
открыть (ќо Бе орепеа), а список С — это список узлов, которые мы 
уже открыли, и больше открывать не будем (атеаду орепед). 

Существуют два принципиальных способа поиска на графе — 
поиск в ширину и поиск в глубину. 

Если список О — это стек, то есть для раскрытия выбирается 
последний положенный узел, то в этом случае говорят о поиске в 
глубину. 

Если список О — это очередь, то есть для раскрытия 
выбирается первый положенный узел, то в этом случае говорят о 
поиске в ширину. 

У поиска в ширину и в глубину есть свои достоинства и 


недостатки. 
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Главное преимущество поиска в ширину состоит в том, что 
решение всегда будет найдено, если оно существует. Поиск в 
ширину просматривает все без исключения узлы, постепенно 
удаляясь от начального узла. С другой стороны, поиск в глубину в 
случае, если граф поиска бесконечен или очень велик, может пройти 
мимо решения, уйти в глубину и не вернуться. 

Главное преимущество поиска в глубину состоит в том, что он 
иногда может оказаться быстрее. Действительно, пусть, например, 
искомый узел находится на расстоянии К от начального узла. В такой 
ситуации поиск в ширину обязательно сначала раскроет все узлы, 
которые находятся на расстоянии, меньшем, чем К, и только после 
этого начнет раскрывать Узлы на расстоянии К, среди которых 
находится искомый. В то время как поиск в глубину, если повезет, 
может пойти к нужному узлу и раскрыть минимальное число узлов на 
прямом пути до цели (в лучшем случае всего раскрывается К-1 узел). 
Вообще говоря, можно показать, что в среднем поиск в глубину 
находит решение примерно вдвое быстрее, чем поиск в ширину. На 
Рис. Ошибка! Текст указанного стиля в документе отсутствует..22 
приведена наглядная иллюстрация причин этого явления. На этом 
рисунке черным выделены узлы, которые будет раскрыты, а 
извилистая стрелка показывает порядок раскрытия узлов. Хорошо 
видно, что поиск в ширину, двигаясь по спирали, может пройти рядом 
с решением и уйти на «штрафной круг», а поиск в глубину, если 
повезет, может почти сразу «наткнуться» на решение. 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..22. Поиск в ширину (слева) и в глубину (справа) 

Обратим внимание на самый внутренний оператор И в 
алгоритме 2.7. При решении любой задачи методом поиска на графе 
всегда существует дилемма — проверять или не проверять 
дублирование узлов? Дублирование может возникнуть, поскольку 
одно и то же состояние базы может получиться как результат разных 
последовательностей применений правил. Если проверять, то будет 
тратиться лишнее время на проверку совпадения, зато не будет 
дублирующих узлов и не будет лишней работы на их повторное 
открытие. Если не проверять, то наоборот, не будем терять времени 
на проверку, но, может быть, будем терять время на повторную 
работу с теми узлами, которые уже встречались. 

Рассмотрим поиск в ширину для задачи о крестьянине, волке, 
козе и капусте (Рис. Ошибка! Текст указанного стиля в документе 


отсутствует..23). 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..23. Граф поиска для задачи о волке, козе и капусте с 
проверкой совпадения узлов 

Заметим важное обстоятельство. Вопреки распространенному 
предрассудку, поиск в ширину может строить меньше узлов, чем 
поиск с возвратами, если проверять совпадения (сравните Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..20 и Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..23, в 
первом случае построено 14 узлов, а во втором — только 10). 
Другими словами, поиск в ширину на графе (полный перебор) может 
в некоторых случаях быть эффективнее поиска с возвратами! 

Но если не проверять совпадения, то может быть построено 
очень много лишних узлов, повторяющих уже имеющиеся. На Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..24 
приведен фрагмент соответствующего графа поиска для этой задачи, 
который, вообще говоря, является бесконечным. Троеточиями на этом 
рисунке обозначены не показанные продолжения графа. Поиск в 
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ширину найдет решение, хотя и затратит много лишней работы, а 
поиск в глубину может «промахнуться» мимо решения. 


0000 
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0010 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..24. Граф поиска для задачи о волке, козе и капусте без 
проверки совпадения узлов 

Общей математически строгой рекомендации относительно 
того, нужно или не нужно проверять совпадения, дать невозможно. 
Неформально можно предположить, что если совпадений немного, то 
их лучше не проверять, а если много, как в задаче про крестьянина, 
волка, козу и капусту, то лучше проверять. 

Еще одно важное наблюдение о свойствах графа поиска можно 
сделать на примере игры в восемь. Как известно, существует 8! = 
40 320 возможных перестановок восьми фишек и, значит, существует 
8!9 = 9! = 362 880 состояний базы данных (число перестановок 
фишек, умноженное на число положений пустой ячейки). Можно 
доказать, что все состояния БД разбиваются на два множества: с 
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четным числом инверсий и с нечетным числом инверсий, причем 
ходы обязательно сохраняют четность. Таким образом, граф поиска 
для игры в восемь состоит из двух компонент связности, причем 
каждая компонента сильно связана. Если начальное и целевое 
состояния базы принадлежат разным компонентам связности, то 
решение невозможно, а если принадлежат одной компоненте, то 
решение обязательно существует. 

Мы видим, что в общем случае конечное множество правил В 
неявно задает, возможно, бесконечный граф поиска, причем он может 
быть как связным, так и несвязным, содержать циклы или не 
содержать циклов. По виду отдельных правил никакого заключения о 
свойствах графа поиска сделать нельзя. 

В терминах графа поиска образно можно сказать, что поиск с 
возвратами — это щуп, который мы засовываем в граф поиска в 
надежде наткнуться на 4,. В результате происходит проявление части 
графа, а часть графа остается скрытой. Поиск на графе — это 
систематическое постепенное проявление всего графа, когда ничего 
не остается скрытым. 


2.3. СПЕЦИАЛЬНЫЕ СИСТЕМЫ ПРОДУКЦИЙ 


Здесь мы обсуждаем различные частные случаи систем 
продукции. Использование специальных свойств частных случаев 
может дать и, как правило, дает неожиданный выигрыш. 


2.3.1.Обратные системы продукций 


Рассмотренные системы продукций всегда начинали поиск от 
исходного состояния и работали до тех пор, пока в результате не 
получали целевое состояние. Такие системы продукций обычно (см. 
начало раздела 2.2) называются прямыми. Логично поступать и 
наоборот — применять обратные правила и двигаться от целевого 
состояния к исходному. Такие системы часто называют обратными. 
Возможны случаи, когда обратная система более эффективна, 
возможны случаи, когда прямая (Рис. Ошибка! Текст указанного 
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стиля в документе отсутствует..25). Образно говоря, это зависит от 
того, где цель больше — в большую мишень легче попасть! 


Данные 


Данные Е» 


Со 


Цель 


Цель 


Обратная система лучше Прямая система лучше 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..25. Прямые и обратные системы продукций 

Для сравнения прямой и обратной систем продукций 
рассмотрим следующую модельную задачу из теории чисел. В этой 
задаче нужно определить, разлагается ли заданное число на заданные 
множители. 

Пусть целевое число равно 60, а множители — 2, 3, 5. 

Прямая система выглядит таким образом. 
ао := {2,3,5}, (а) := 60еа 
В := 1Е хеа & уєа & хуяа & ху<61 +һҺеп а:= а9\/{ху} 


Поиск в ширину дает следующие результаты (19 применений 
правил). 


А З 5 (исходные множители) 

4 6 9 ШО. 15, Е (попарные произведения) 
8 12. 18. 20 30 50 (вторая строка *2) 

27 45 (вторая строка *3) 


(вторая строка *5 – нет новых) 
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16 24 36 40 60 (третья строка *2 — достигнута 
цель) 


Поиск в глубину дает следующие результаты (4 применения 
правил). 
2 З 2 
15 45 30 60 
Обратная система будет такой. 
ао := {60}, (а) := 1еа 
В := { 1Е хєа & х:2 +Һеп а := а\{х}‹{х/2} 
1Е хєа & х:3 &Һеп а 953] 
1Е хеа & х:5 +ћҺеп а := а\{х}\/{х/5} } 
Поиск в глубину дает следующие результаты (4 применения 


правил). 
60 
НО 5. 9 НВ 
Поиск в ширину дает следующие результаты (11 применений 


правил). 

60 

ЗО 5205 574 

19 10 6 4 
8 5, 2 

ЯК 


Здесь цель — единственная, а данных — три, поэтому, как и 
следовало ожидать, обратная система дает чуть лучшие, чем прямая, 
но сопоставимые результаты. 

Но если поставить другую, более расплывчатую цель: какие 
числа, меньшие или равные 60, можно получить из множителей 2, 3, 
5, то сравнение систем покажет совсем другую картину. 
Действительно, прямая система при этом отличается отсутствием 
условия окончания и должна работать, пока не остановится ввиду 
отсутствия применимых правил. Накопленное состояние базы данных 
будет ответом на вопрос задачи. 
ао := {2,3,5} 
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В := 1Е хеа & уєа & хуға & ху<61 Беп а:= а9\/{ху} 
Поиск в ширину дает следующие результаты (22 применения 


правил). 

С З 5 (исходные множители) 

4 6 9 0, 15. 208 (попарные произведения) 

8 125 107 720. 30-50 (вторая строка *2) 

АТ. 245 (вторая строка *3) 
(вторая строка *5) 

16 24 36 40 60 (третья строка *2) 

54 (третья строка *3) 

32 48 (птестая строка *2) 


Поиск в глубину даст такие же результаты, только числа будут 
найдены в другом порядке. Это следует из того, что в данном случае 
оба вида поиска обойдут один тот же граф, посетив каждый узел 
только один раз. Заметим, что количественные результаты 
расширенной постановки нашей задачи практически совпадают с 
результатами исходной — в первом случае алгоритмом поиска в 
ширину всего лишь три узла не были построены. То есть в исходной 
постановке задачи для поиска в ширину прямая система не была 
направлена на цель, фактически система продукций решала более 
общую задачу, а не ту, что требовалось. 

Теперь постараемся ответить на вопрос, какие числа, меньшие 
или равные 60, можно получить из множителей 2, 3, 5, используя 
обратную систему продукций. Сразу ясно, что придется 60 раз задать 
вопрос, представимо ли очередное число. При этом, используя, 
например, поиск в глубину, будет найден ответ для каждого числа, 
причем число применений правил минимум = 0 (если проверяемое 
число простое), максимум = 5. В среднем — около двух применений 
правил для проверки одного числа. Это означает, что обратная 
система в данном случае на порядок хуже, и нет необходимости 
загромождать книгу утомительным описанием ее работы, — 
столбцами ненужных чисел. С другой стороны, если потребовать 
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просто разложить число 60 на множители, то обратная система, 
очевидно, будет более эффективна. 

Вывод из этого примера таков: в искусственно- 
интеллектуальных системах очень важно учитывать детали задач. 


Иногда учет деталей важнее следования общим принципам. 
2.3.2. Двусторонние системы продукций 


Прямые и обратные системы называются односторонними, так 
как поиск двигается строго в одном направлении — к цели или от нее. 
Однако, если существует только одно целевое состояние и одно 
исходное состояние, то направления эквивалентны (например, при 
игре в восемь). В таком случае можно одновременно двигаться от 
данных к цели и от цели к данным, проверяя, не появилось ли общее 
состояние, которое свидетельствует о том, что решение найдено. Это 
принцип действия двусторонней системы продукций. 

Можно ожидать, что если используется малоинформированная 
стратегия управления, то двусторонняя система продукций окажется 
эффективнее односторонней, поскольку суммарно меньше узлов 
будет раскрыто, например, при поиске в ширину (Рис. Ошибка! Текст 
указанного стиля в документе отсутствует. .26). 
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Прямая система Двусторонная система 


Целевой узел 
Место встречи 
Исходный узел 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..26. Преимущество двусторонней системы продукций 

Однако это не всегда так. Если используются очень хорошие 
эвристики, которые целенаправленно ведут от данных к цели и от 
цели к данным, но при этом разными путями, то может оказаться, что 
двусторонняя система хуже, чем любая односторонняя (Рис. Ошибка! 
Текст указанного стиля в документе отсутствует..27)! 


Обратная система 


Исходный узел 


Прямая система Целевой узел 


Место встречи 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..27. Двусторонняя система с направленными эвристиками 
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2.3.3. Коммутативные системы продукций 


Система продукций с множеством правил Е называется 
коммутативной, если выполнены следующие три условия: 

У4еЕР (г1.р (а) & т2.р (а)  12.р Т.Р (а))) 

- если два правила применимы, то при применении одного, 
другое остается применимым; 

УЧер ( г.р(а) & Ка) > Кг Ла) ) 

- если цель достигнута, то навсегда, применение правил не 
отменяет достижения цели; 

ӯ4єр (71.р(а) & г2.р(а) > г2. К" Ка)) = 71. Кт2.Ка)) ) 

- если два правила применимы, то их можно применять в любом 
порядке. 

Рассмотренная в параграфе 0 система продукций для чисел 
является коммутативной. Другой пример коммутативной системы 
продукций — игра в восемь, а вот задача о крестьянине, волке, козе и 
капусте — это некоммутативная система. 

Заметим, что третье условие, условие коммутативности, не 
означает, что можно произвольно переупорядочить 
последовательность правил, то есть утверждение 
Уа (72. Ки Ка)) = 71.Кт2.Ка))), вообще говоря, неверно. Но те 
правила, которые применимы в данный момент, можно применять в 
любом порядке. 

Одним из важных достоинств коммутативной системы 
продукций является возможность всегда использовать безвозвратный 
режим, так как применение правила ничего не портит. 

Теорема. Всякую СП можно преобразовать в коммутативную. 

Доказательство. Пусть задана система продукций 5 = < р, В, С 
> с начальным состоянием базы 4. Рассмотрим ее граф поиска С. 
Построим новую систему продукций 5' =< О", В', С' >. Базой данных 
системы 5’ будет граф поиска системы 5. Правила ҜК' новой 
системы — это различные способы преобразования графа поиска, 
которое можно делать с помощью стратегии С в старой системе 
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(раскрытие узла). Новая система продукций коммутативна. 
Действительно: 

- если в старой системе два узла находятся в списке О, то 
раскрытие одного узла не препятствует раскрытию второго узла, так 
что первое условие коммутативности выполнено; 

- если в старой системе в графе поиска построен терминальный 
узел, то раскрытие других узлов не исключит из графа терминального 
узла, так что второе условие коммутативности выполнено; 

- если в старой системе два узла находятся в списке О, то их 
можно раскрывать в любом порядке, получится один и тот же 
результат, так что третье условие коммутативности выполнено. Ч.т.д. 

Доказанная теорема мало что дает на практике. Хотя полученная 
новая система коммутативна, но преобразование резко увеличивает её 
объем по сравнению с исходной. Выигрыш за счет применения 
безвозвратного поиска оказывается меньше, чем проигрыш за счет 
разрастания систем при преобразовании. 

Подкрепим общие оценочные суждения примером 
коммутативной системы для упрощения алгебраических выражений, 
построенных из: переменной х, натуральных коэффициентов, 
операций сложения, умножения и возведения в натуральную степень 
(полиномы одной переменной). Имеется набор правил 
преобразования: 

1. Раскрыть скобки 

2. Привести подобные 

3. Упорядочить по степеням 

Эти правила всем известны со школы, поэтому мы не стали 
записывать их формально. Попытаемся упростить выражение 
1+х(1+х(3 +х+х)) (Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..28). 
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1+х(+х@+х+х)) 


1 3 
2 
хех 1+х(+х@+2х)) х(х(х+х+3)+1)-+1 
2 З 1 З - 
1+х+3х° +2% е В! х(х(2х+3)+1) +1 
з - 1 


2х3 + 3х2 +х+1 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..28. Упрощение выражений 

Если правило что-то меняет — применяем его. Для полиномов 
окончательный результат не зависит от порядка применения правил. 
Фактически здесь система продукций не содержала условий — это 
пример системы подстановки термов, или системы правил 
переписывания (егтз$ темтИте гшеѕ), которые относятся к 
однородным системам продукций. 

Система правил переписывания (Тегт-геургійпо ѕуѕіет) — 
конечное множество правил переписывания К, определяющее на 
множестве термов бинарное отношение —> (отношение редукции). 

Говорят, что система правил переписывания К обладает 
свойством Чёрча-Россера, если для любых термов і} и Ь выполняется 
равносильность і = в том и только в том случае, когда 
существует единственный терм із, такой, что і э ђ и э ђ. В 
этом случае, СПТ называется полной или канонической, а 
результат применения правил В к исходной формуле — канонической 
формой. 
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В данном случае система обладает свойством Чёрча-Россера. 
Это очень сильное, полезное и редкое свойство, которое позволяет 
легко решить автоматически многие задачи, такие как проверка 
равенств, решение уравнений и т.д. Однако канонические формы 
существуют не для всех классов алгебраических выражений. 
Существуют и наверное известны читателю канонические формы для 
полиномов одной переменной и для булевых формул. В то же время, 
например, для элементарных функций математического анализа 
(дробно-рациональные функции, логарифм, экспонента и их 
суперпозиции) нормальной формы не существует”. 

Покажем существенность свойства Черча-Россера путем, на 
первый взгляд, незначительного усложнения рассматриваемого 
примера упрощения алгебраических выражений. Попытаемся 
упростить выражение х(1+1/х), которое в результате должно 
превратиться в х+1. Для этого в наш пример необходимо добавить 
операцию деления и два правила: 

4. Привести к общему знаменателю 

5. Сократить числитель и знаменатель 

Легко видеть, что теперь результат зависит от порядка 
применения правил! То есть, система продукций уже не является 
коммутативной. Более того, в некоторых случаях возможны тупики в 
поиске. В результате один из путей не редуцируется правилами 1-5 
(Рис. Ошибка! Текст указанного стиля в документе отсутствует..29). 


^” Это объясняет, почему задачи, предлагаемые на экзаменах по 
элементарной математике («решить уравнение», «упростить выражение»), 
действительно иногда являются задачами, которые для своего решения 
требуют изобретательности и фантазии, а не только механического 
применения заученных правил. Доказательство отсутствия канонической 
формы для выражений в элементарных функциях было найдено 
сравнительно недавно и принадлежит к числу важных математических 
результатов последнего времени. 
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х+1 
х 
Пек ү 1 
= х(х +1) 
5 х 
= 
н 5 
х?+ х 
х+1 
Тупик! Цель 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..29. Тупики при поиске 

Для решения этой проблемы, связанной с образованием 
тупиковых ветвей, добавим обратные операции: 

6. Вынести за скобки 

Если ввести только правило 6 (вынесение за скобки), то будут 
два взаимно-обратных правила: раскрытие скобок и вынесение за 
скобки, а это значит, что возможно зацикливание, то есть свойство 
Черча-Россера не выполняется по-прежнему. Чтобы тупик на Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..29 сделать 
редуцируемым, необходимо добавить правило 7: 

7. Разложить дробь 

(и+у/м=и/ш+у/ м 

Но тогда может появиться бесконечное зацикливание, такое, 
которое при безвозвратном поиске невозможно распознать (на Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..30 один из 
возможных циклов обведен овалом). 
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х+1 


х2 х ПЕ ый 
ЕЕ 


х х 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..30. Циклы при поиске 

Вывод по данному примеру: коммутативность системы 
продукций — очень мощное и полезное свойство. Нужно 
стремиться строить коммутативные системы продукций, а в тех 
случаях, когда это невозможно, стоит проверить, нельзя ли немного 
ограничить задачу, но так, чтобы стало возможным построить 
коммутативную систему. 


2.3.4. Разложимые системы продукций 


Коммутативность системы продукций предоставляет свободу 
выбора применяемого правила. Это не единственное свойство, 
которое дает такую свободу. 

Если исходная система продукций может быть разложена 
(ршипе) в сумму систем продукций, которые могут 
рассматриваться независимо, то такую систему называют 
разложимой системой продукций. 
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Хороший пример разложимой системы продукций дают 
формальные порождающие грамматики. Рассмотрим простой пример 
на эту тему. Пусть имеются правила 
А – ВС 
А 
Сә ТТ. 

Вопрос к системе продукций: можно ли из слова АС получить 
цепочку, содержащую только символ 7? Ниже представлены графы 
поиска для обычной (Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..31) и разложимой (Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..32) системы продукций. В 
первом случае мы осуществляем все возможные переходы из 
начального выражения. В втором случае мы сначала разлагаем 
исходную базу данных (слово АС) на две части (слово А и слово С), а 
затем строим графы поиска для каждой части. Здесь представлены 
полные графы поиска, и из них видно, что решение получить можно. 
Действительно, на Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..31 существуют пути (их три, листовые узлы выделены 
цветом), ведущие из начального узла в терминальный, а на Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..32 имеется 
одна пара путей, ведущий в терминальные узлы для каждой из двух 
частей разложения. Узлы, входящие в решение, на Рис. Ошибка! 
Текст указанного стиля в документе отсутствует..32 обведены овалом. 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..31. Граф поиска для обычной системы продукций 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..32. Граф поиска для разложимой системы продукций 

Если сравнить рисунки Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..31 иРис. Ошибка! Текст указанного стиля в 
документе отсутствует..32, то легко заметить, что в первом случае 
проделывается много лишней работы: результат применения правил в 
левой ветви приводит в тупик. Использование разложения в этом 
примере сокращает граф поиска более чем в два раза! 

Основная процедура для разложимой системы продукций 
представлена в Алгоритм Ошибка! Текст указанного стиля в 
документе отсутствует..8. 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..8. Интерпретатор разложимой системы продукций. 
ргос 5р1іі (а, В, +) 


А := ПБесопрозе (а) 
мр11е Егае ао 
Бог аєл2А ао 
1Е (а) +Һеп Л := Л \ {9} епа іғ 
епа Ғог 


1Е Л = © %Ъеп геіигп (ОК) епа 1Е 
Я := Ѕе1есір (А) 
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А:= А \ {а} 

г := бе1есЕ (а, В) 

1Е г = п11 іҺеп геіџгп (Ёа11) епа 1Е 
А := А о ресотроѕе (г.Е(а)) 

епа мһі1е 
епа ргос 

Это аналог процедуры Ргоацосііоп, самой первой и общей (см. 
параграф 0). Процедура ресотроѕе разлагает базу данных на 
несколько частей (или оставляет без изменения, если в данном 
состоянии базу разложить невозможно). В известном смысле это 
похоже на операцию раскрытия узла, но все-таки отличается от нее, 
поэтому на Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..32 дуги, соответствующие разложению, а не раскрытию, 
выделены серым цветом. Далее, функция Ѕе1есїр аналогична 
функции Ѕе1есі, она фактически выбирает узел для дальнейшей 
работы. 

Сделаем важное замечание. С точки зрения теории графов, та 
дуга, которая появляется в графе поиска в результате применения 
правила разложения, является гипердугой — дуга, исходящая из 
разлагаемой базы и ведущая сразу в несколько баз, являющихся 
частями разложения. Для того чтобы прийти к решению, нужно найти 
решение для первой части И для второй части И так далее. Поэтому 
такая гипердуга называется И-дугой. В случае если из узла выходят 
обычные дуги, соответствующие применению правил, то они имеют 
следующий смысл: чтобы найти решение, нужно применить первое 
правило, ИЛИ второе правило, ИЛИ и так далее. Поэтому такие дуги 
называются ИЛИ-дугами. Если в графе применяются только такие 
дуги, он называется графом И/ИЛИ. В следующих двух главах мы 
вернемся к этим понятиям и обсудим их более детально, см. 
параграфы 3.3 и 4.5.1. 

Для описания языков программирования и других 
искусственных языков с успехом используется теория формальных 
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грамматик, разработанная А. Н. Хомским. Вкратце ее суть 
заключается в следующем. Рассматривается конечный алфавит А 
(множество символов) и язык над этим алфавитом. Здесь язык — это 
просто множество  последовательностей символов алфавита 
(цепочек). Другими словами, среди всех возможных цепочек 
(которых заведомо бесконечно много) нужно иметь возможность 
выделить те и только те, которые являются цепочками языка (еще 
говорят «входят в язык», «принадлежат языку», «являются 
выражениями языка»). 

Для описания (бесконечного) множества цепочек Хомский 
предложил использовать формальную порождающую грамматику — 
конечное множество правил вида оа, где о и В конечные цепочки, 
составленные из символов алфавита А (которые называются 
терминальными символами) и из символов некоторого 
дополнительного алфавита № (эти символы принято называть 
нетерминальными). В левую часть правила (т. е. в цепочку а) 
обязательно должен входить хотя бы один нетерминальный символ. 
Среди всех нетерминальных символов выделяется один, который 
называется начальным символом (или аксиомой) грамматики. 

Далее все очень просто. Взяв за основу аксиому грамматики, 
разрешается строить новые цепочки, заменяя в уже построенной 
цепочке любое вхождение левой части любого правила на правую 
часть этого правила. И так до тех пор, пока в цепочке не останутся 
одни терминальные символы. Всякая цепочка терминальных 
символов, которую можно построить таким процессом, по 
определению входит в язык, а если цепочку нельзя так построить, то 
она не входит в язык. 

Разумеется, все это так просто, пока не поставлены разные 
каверзные вопросы. Всякий ли язык может быть определен таким 
способом? Если дана грамматика и конкретная терминальная цепочка, 
то как узнать, принадлежит она языку или нет? Однозначен ли 
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процесс порождения цепочки? Зависят ли ответы на предыдущие 
вопросы от вида (формы) правил? 

Но если основная идея ясна, то можно оставить эти (весьма 
трудные) вопросы математикам и принять тот факт, что синтаксис 
подавляющего большинства языков программирования легко 
описывается подклассом формальных грамматик, которые 
называются контекстно-свободными (левая часть всех правил состоит 
из одного нетерминального символа). Для этого подкласса грамматик 
все вопросы, связанные с распознаванием принадлежности цепочки 
языку (это называется синтаксическим анализом, или разбором) 
надежно решены. 


ВЫВОДЫ ПО ГЛАВЕ 2 


1. Системы продукций — это исторически первый и до сих пор 
часто применяемый способ представления знаний. 

2. Системы продукций эффективно программно реализуемы и 
являются основой многих практических программных систем. 

3. Использование систем продукций может принести пользу 
только при полном понимании всех сопутствующих им ограничений 
и недостатков. 


ГЛАВА 3. АЛГОРИТМЫ ПОИСКА РЕШЕНИЯ 


Алгоритмы поиска решения столь многочисленны и 
разнообразны, что использование этого термина без надлежащих 
комментариев может ввести в заблуждение. В общем случае 
алгоритм поиска ищет решение поставленной задачи в некотором 
пространстве поиска. Пространство поиска может быть дискретным, 
а может быть непрерывным; может быть конечным, а может быть 
потенциально бесконечным; метрические свойства пространства 
могут быть заданы, а могут быть неизвестны; характеристики 
искомого решения могут быть фиксированы, а могут меняться в 
процессе поиска. Во всех этих и во многих других случаях 
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применяются самые разнообразные алгоритмы, которые, порой, 
имеют весьма мало общего. По нашему мнению, исчерпывающий 
обзор всех алгоритмов поиска вообще вряд ли возможен технически, 
да и ценность такого гипотетического обзора была бы сомнительна. 
Поэтому мы ограничиваемся одной конкретной областью — 
алгоритмами поиска решения в прикладных системах с элементами 
искусственного интеллекта. 

Даже при таком ограничении подробная аналитика всех 
используемых алгоритмов представляется чрезмерно объемной. Мы 
позволим себе еще больше сузить область рассмотрения, 
ограничившись анализом наиболее популярных и представительных 
подходов к поиску вывода в системах, опирающихся на продукции, 
т.е. использующих в качестве базовых конструкции вида р -> 4, 
введённые во второй главе. В сделанных соглашениях пространство 
поиска естественно представлять графом (или сетью) специального 
вида, в котором узлы представляют состояния базы фактов, а дугам 
соответствует применение продукций”. Результатом поиска 
решения на графе всегда является некоторый маршрут (цепь, вывод), 
ведущий от начального узла в целевой узел. Новое сужение области 
исследований, разумеется, упрощает нашу задачу, однако и теперь мы 
не можем выделить одного наилучшего универсального алгоритма 
поиска решения! Дело в том, что очень важную (если не 
определяющую) роль при поиске решения играют конкретные 
свойства узлов и дуг графа поиска, определяемые прикладным 
назначением, а, следовательно, и природой самих продукций. 

Таким образом, задачу поиска решения в системе продукций 
можно свести к задаче поиска маршрута на графе. Подбирая 


Е Представление пространства поиска в виде ориентированного 
графа действительно является естественным и широко распространенным, 
но оно ни в коем случае не является обязательно наилучшим или 
единственно возможным. Существуют и используются альтернативные 
представления, некоторые из них рассматриваются в последующих главах 
ЭТОЙ КНИГИ. 


135 


подходящий алгоритм для решения конкретной задачи на графе, мы 
должны принимать во внимание множество характеристик графа 
поиска (за расшифровкой терминов направляем, например, к книге 
[17], а именно: является ли граф ориентированным (орграф), 
допускаются ли в нем циклы (и какой эти циклы природы), могут ли 
два узла соединяться более чем одной дугой (мультиграф), является 
ли граф многодольным (и какой степени), что нам известно о 
связности и степенях вершин графа, какова мощность множеств узлов 
и дуг (является ли граф конечным), является ли граф размеченным, 
взвешенным (и какова комбинация этих свойств) и многое другое. 
Важно понимать, что все эти свойства задаются постановкой задачи, 
точнее выбором представления для поставленной задачи, и не 
являются произвольными. Например, если у нас есть хороший 
алгоритм для ациклических графов, но граф поиска для данной задачи 
содержит циклы, то от этого алгоритма мало толка. 

В последнее время значительное внимание привлекают задачи, 
характеризующиеся в самом общем виде, как задачи построения 
оптимального маршрута. Примерами соответствующих прикладных 
областей могут выступать логистика (минимизация времени 
транспортировки грузов между складами), управление движением 
роботов (в среде с ограничениями и препятствиями), стратегические 
игры и многое другое. Графы поиска для подобных задач являются 
«вполне приличными» — ориентированными однодольными 
орграфами — узлом графа обычно выступает просто имя (или точка 
пространства, как правило, метрического и небольшой размерности), 
плотность невысока (далеко не все узлы связаны друг с другом 
непосредственно), степень узла 4 всегда оценивается ограниченной 
константой (4е>(4) < сопѕї << п, где п — число узлов графа), вес на 
дуге определяет только стоимость перехода из одного узла в другой, 
исходный и целевые узлы однозначно определены. При этом 
считается, что необходимая для решения задачи построенная часть 
графа поиска может быть целиком размещена в «быстрой» 
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(оперативной) памяти компьютера. Основная рассматриваемая в этой 
главе задача состоит в построении оптимального (минимизирующего 
ресурсные затраты) маршрута от исходного узла к целевому. 

В главе рассмотрены пять алгоритмов: 

- общий алгоритм эвристического поиска решения для систем 
неоднородных продукций (раздел 0); 

- формальные свойства исторически первого и самого 
известного алгоритма поиска на графе (раздел 0); 

- изящный способ повышения эффективности и практической 
применимости общего алгоритма поиска решения (раздел Ошибка! 
Источник ссылки не найден.) 

- алгоритм поиска на графах И/ИЛИ, который является 
специализацией общего алгоритма, возникающей, например, при 
использовании разложимых систем продукций (раздел 0); 

- алгоритмы поиска на игровых деревьях, которые являются, с 
одной стороны, дальнейшей специализацией общих алгоритмов, 
поскольку игровые деревья — это частный случай графов И/ИЛИ, и, с 
другой стороны, являют собой наиболее проработанные на 
сегодняшний день практические алгоритмы реальных программ с 
элементами ИИ указанных в начале главы классов (раздел 0). 

Такой набор рассматриваемых алгоритмов образует систему, 
достаточную для того, чтобы читатель после прочтения главы мог 
уверенно ориентироваться в море разнообразных конкретных 
алгоритмов поиска — основные маяки мы обозначили. 


3.1. ЭВРИСТИЧЕСКИЙ ПОИСК 


Исторически одним из первых и самым известным в ИИ 
алгоритмом для поиска оптимальных (по суммарному весу или длине) 
путей в графе пространства поиска считается алгоритм А* (читается 
как «А-звездочка», или «А-стар»). Этот алгоритм был впервые описан 
в 1968 году Питером Хартом, Нильсом Нильсоном и Бертрамом 
Рафаэлем [18]. В их работе он упоминается как «алгоритм А». В 
классическом варианте алгоритм А* применим в дискретном 
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пространстве поиска. представленном графом поиска с 
нагруженными дугами. Этот эвристический поиск сортирует узлы 
графа по значению функции, которая оценивает длину кратчайшего 
пути, проходящего через данный узел, и идущего от начального узла 
к одному из целевых. Таким образом, этот алгоритм сочетает в себе 
учет длин оптимальных путей из уже исследованной части графа 
поиска из алгоритма Дейкстры с эвристикой наискорейшего спуска“ 
для еще неисследованной части графа. 


3.1.1. Общий алгоритм 


Для уточнения дальнейшего изложения повторим определение 
графа поиска, сделаем несколько важных замечаний и выпишем 
общий вид алгоритма поиска на графе. 

Граф поиска — это ориентированный граф С (У, Е), в котором 
множество узлов У= {а |а єр } — это множество возможных 
состояний базы фактов (в смысле предыдущей главы), а множество 
дуг Е определяется следующим образом: 

Е = { аэФ | 4, є О & З гєК ( г.р(а,) & = ғ.а) ) }. 

В случае, когда граф поиска существенно конечен, его можно 
задать явно с помощью обычных способов представления графов в 
компьютере. Зачастую, в подобных случаях именно граф поиска 
выбирается в качестве механизма представления знаний — пометки 
на дугах-переходах являются продукциями, отдельно задавать 
множество продукций нет необходимости. 

В случае бесконечного (или очень большого) графа мы не 
можем использовать указанные простые представления, просто 
потому, что весь граф не помещается в памяти компьютера. Вместо 
этого мы, начиная с исходного состояния базы данных 4о, с помощью 
конечного множества правил К порождаем некоторую часть графа 
поиска, до тех пор, пока либо не будут исчерпаны выделенные 
ресурсы, либо порожденная часть не будет содержать целевое 


47 х 
Метод наискорейшего спуска описан в параграфе 2.2.2. 
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состояние базы данных а. Таким образом, используется неявное 
(имплицитное) представление графа в компьютере. Неявно граф 
может быть задан с помощью операции раскрытия узла. 

Считается, что каждому правилу г сопоставлена стоимость его 
применения, обозначаемая г.у и называемая стоимостью или весом 
(ууе1> 50) применения правила. В этом случае, в графе поиска каждая 
дуга будет иметь вес. Другими словами, дуги нагружены, причем 
величину нагрузки можно считать положительной: 

г= (р, }, м), м> 0. 

Стоимость пути в графе определяется как сумма стоимостей 
входящих в него дуг. Общий алгоритм поиска на графе, который 
вычисляет стоимость путей от исходной вершины и (при выполнении 
определенных условий!) определяет путь минимальной стоимости“, 
выглядит следующим образом. 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..9. Общий алгоритм поиска на графе. 


ргос С$ (90, В, Ф) 


о := {90}; 9(90) := 0 
С := 9; Р (90) := һі1 
мр11е Егае ао 

Я := бе1Іесі (0) 


1Е а = п11 іёҺеп геіџгп (Ёа11) епа 1Е 
1Е (4) +Һеп геіџгп (ОК) епа 1Е 
Ореп (а) 
епа мһі1Іе 
епа ргос 


ргос Ореп (а) 


Ғог г є В Яо 


* Можно использовать геометрическую терминологию. В этом 
случае величину нагрузки на дугу называют длиной дуги. Сумма длин дуг, 
входящих в путь, называется диной пути, а задача формулируется как 
задача отыскания кратчайшего пути. 
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1Е г.р(а) ЕБеп {правило применимо} 
е М аа) 
Е оке тае, 


1Е а’ є ом а’ є С +ћеп {старый узел} 
1Е с’ < (4°) ЕБеп {путь лучше} 


агае) = с’ 
Р(а’) := а 
епа 1Е 


е1зе { новый узел } 


О := О+{а' } 
а (7) и” 
Р(а’) := а 
епа 1Е 
епа 1Е 

епа Ғог 

О; ЕКО =. 19] 

Съ = СЕ О 

епа ргос 


где О — список «открытых», С — список «закрытых» узлов (см. 
параграф 2.2.4). 

Помимо обычных параметров и уже обсуждавшихся списков 
открытых и закрытых узлов, процедура использует еще две структуры 
данных. Первая из них — (4) — длина кратчайшего пути от 4 до а 
из тех, что исследованы к этому моменту. Заметим, что 8(4) = 0, для 
прочих узлов в начале работы 2(4) неизвестно и по мере работы 
алгоритма значение 8(4) для данного узла 4 может разве что 
уменьшаться. 

Особого обсуждения заслуживает структура данных Р(4) — эта 
структура хранит для узла 4 предшествующий узел на найденном 
кратчайшем пути от 4 до 4. Такой прием позволяет эффективно 
хранить множество путей, ведущих от узла 4 сразу ко всем 
исследованным узлам. 
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В этом алгоритме поиска на графе есть две функции — 5е1есЕ 
и Ореп. Неформально говоря, первая из них есть «поиск», а вторая — 
«на графе». 

Функция Ѕе1есё каким-то образом определяет очередной узел 
для раскрытия. Если функция Зе1есЕ (0) работает по принципу 
ЕТЕО (Е1гѕ Іа Еи$ Оо), то есть, если список О — это очередь, то 
происходит поиск в ширину. Этот метод гарантирует нахождение 
пути к целевому узлу, если такой путь существует. Если функция 
бе1есЕ (0) работает по принципу ЦЕО (Газ Та Еи$ё Ои), то есть, 
если список О — это стек, то происходит поиск в глубину; этот метод 
подобен поиску с возвратами, но хранится уже не один текущий, а все 
просмотренные пути. 

Поиск в ширину и поиск в глубину — это примеры 
неинформированных процедур поиска. Если про задачу ничего 
неизвестно, то приходится применять неинформированные 
процедуры, но на многое при этом рассчитывать не приходится. Для 
эффективного поиска решения необходимо использование 
дополнительной информации о задаче. Такая дополнительная 
информация часто называется эвристической. Смысл этого термина 
раскрывается в следующем параграфе. 


3.1.2. Эвристические алгоритмы 


Древнегреческое слово «эвристика» (ғџроіско — отыскиваю, 
открываю) имеет много близких, но различных значений и способов 
употребления в современном языке. В литературе можно, среди 
прочих, найти следующие толкования этого понятия. 

Эвристические методы — специальные методы решения задач, 
которые обычно противопоставляются формальным методам 
решения, опирающимся на точные математические модели. 
Использование эвристических методов не гарантирует, что 
получаемые решения являются наилучшими, неудачная эвристика 
может привести и к получению наихудшего результата! В то же время 
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известно множество удачных эвристик (для решения конкретных 
задач), обеспечивающих” получение приемлемых решений за 
допустимую цену. 

Эвристическая деятельность — организация процесса 
продуктивного творческого мышления. В этом смысле эвристика 
понимается как совокупность присущих человеку механизмов 
решения творческих задач. Эти механизмы универсальны по своему 
характеру и не зависят от конкретной решаемой проблемы.” 

Эвристическое программирование — способ написания 
программ, при котором программист не кодирует готовый 
математический метод решения, а пытается формализовать тот 
интуитивно понимаемый метод решения задачи, которым, по его 
мнению, пользуется человек при решении подобных задач. Как и 
эвристические методы, эвристические программы не дают 
абсолютной гарантии достижения поставленной цели и 
оптимальности получаемого результата. 

Эвристическое обучение — специальный метод обучения 
(сократические беседы) или коллективного решения проблем, 
исторически восходящий к Сократу. Метод состоит в задании 
обучающимся серии наводящих вопросов и примеров, в результате 
чего они как бы сами отыскивают решение. 

В нашем случае мы понимаем термин «эвристика» в более 
узком смысле. 


* Подчеркнем еще раз тот факт, что мы можем даже не вполне 
понимать, как работает та или иная «удачная» эвристика и почему она 
обеспечивает «приемлемость» решения! Всё это, в некоторой степени, 
сродни волшебству, но волшебству конкретному, действующему, а 
потому — полезному! 


> Эврика! (буквально — я нашел!), согласно преданию, восклицание 
Архимеда при открытии им основного закона гидростатики. В переносном 
смысле это выражение радости, удовлетворения при решении какой-либо 
сложной задачи или возникновении новой идеи. 
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Эвристика — эмпирическое” правило, упрощающее или 
ограничивающее перебор вариантов при поиске решения в 
конкретной предметной области. 

Более того, поскольку здесь мы рассматриваем совершенно 
конкретный способ поиска решения в данной предметной области — 
поиск на графе для системы продукций, мы можем еще более 
конкретизировать определение. 

Эвристика — набор правил выбора очередного узла для 
раскрытия, который должен, по мнению автора эвристики, вести к 
решению проблемы. 

К сожалению, эвристика опирается на догадки и интуицию, а не 
на точные знания, эвристика использует доступную, но ограниченную 
информацию, такую, как описание множества текущих открытых 
узлов, и не может гарантировать, что выбор действительно 
наилучший. Эвристика — это лишь предложение для выбора 
следующего шага, основывающееся на опыте и здравом смысле. 

Алгоритм, использующий эвристики, называется 
эвристическим алгоритмом. 

Эвристики уменьшают вычислительные затраты на применение 
правил за счет того, что сокращают общее количество применений 
правил. Но применение самих эвристик также требует каких-то 
вычислений и привносит свои затраты. Кроме того, манипуляции с 
графом поиска, особенно если он велик, также требуют затрат (еще 
раз см. рис. 2.5). 

На самом деле, нас интересует общая сумма, складывающаяся 
из затрат на применение правил, затрат на проверку и раскрытие 
узлов и затрат на эвристику. Точнее говоря, мы хотим 


у Это слово в определении является чрезвычайно важным! Оно 
подчеркивает тот факт, что правило не является формально обоснованным 
и обеспечивает «упрощение» и «ограничение» по чьему-то мнению и вовсе 
не обязательно. 
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минимизировать среднее значение этой суммы по всем случаям 
применения эвристического алгоритма. 

Чтобы поставить задачу точно, необходимо дать определения и 
ввести обозначения, что мы и делаем в следующем параграфе. 


3.1.3. Оценочная функция 


Эвристическая информация может иметь любую форму. В ИИ 
принято представлять эвристическую информацию в виде оценочной 
функции Е(4). 

Оценочная функция Ё определена на множестве допустимых 
состояний среды (базы фактов) и принимает вещественные числовые 


значения Е: р —> К. Причем обычно выбирают оценочную функцию 


таким образом, чтобы на терминальных узлах ее значение было 
минимально Ё(4;) = тіп { 4єр | Е(а) }. Если задана такая оценочная 
функция, то можно записать функцию Ѕе1есіЕ, используя идею 
наискорейшего спуска (Алгоритм Ошибка! Текст указанного стиля в 
документе отсутствует..10). 
Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..10. Функция выбора узла для раскрытия. 
Ргос бе1есЕ (0) 
п := © 
Я’ := 1011 
Бог а є О до 
1Е Е(а) < ш +Һеп 
Ч’ :=а 
п := Е(а) 
епа 1Е 
епа Ғог 
гесцгп (4” ) 
епа ргос 
Или, короче: 


Ѕе1есі (0) := міп Е(4а), а є О 


144 


Для оценочной функции Ё предложено много различных идей 
реализации. Слово «оценочная» означает, что Ё (предположительно) 
близка к каким-либо важным характеристикам поиска. Ниже 
приведен список некоторых характерных свойств, которые часто 
пытаются использовать при выборе оценочной функции: 

- величина, обратная вероятности того, что 4 принадлежит 
оптимальному пути; 

- расстояние от узла 4 до целевого множества узлов 7; 

- вес пути от исходной вершины 4 до целевой вершины 4; через 
текущую вершину 4. 

В этом разделе мы рассматриваем именно последний случай. 

Будем рассматривать оценочную функцию в следующей форме: 

Е(а) = (9) + 00), 

где ©(4) — фактическая стоимость пути от исходной вершины 4 
до а (уже определена нами в процедуре Ореп); В(а) — эвристическая 
оценка стоимости пути от 4 до целевой вершины 4.. 

Рассмотрим процесс выбора оценочной функции на примере 
игры в 8 [13] (уже обсуждавшейся нами в параграфе 2.1.4). Введем 
оценочную функцию Е() как сумму глубины в дереве (соответствует 
функции 2(4)) и числа шашек не на своем месте (соответствует 
функции В(49)). Мы видим (Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..33), что с такой оценочной функцией поиск на 
графе оказывается весьма эффективным и быстро приводит к 
решению. 

Сделаем несколько наблюдений по этому примеру: 

- 5(4,) = 0, так как в целевой позиции все шашки находятся на 
своем месте по определению; 

- (а) не превосходит минимального числа ходов, которые 
необходимо совершить, чтобы перейти из і в й; 

- значение функции Е (а) для раскрываемых узлов не убывает; 

если взять функцию Е только как глубину в дереве, то есть 


положить һ=0, то получится просто поиск в ширину. 
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В следующем 


разделе мы обобщим и истолкуем эти 


эмпирические наблюдения. 


Ка) =4 
2 |8, |28 
= 
И 
Э) 1 6 4 
‚= 
7 5 
и" а 
С О) 4 ~ Еа = 6 
Е = 6 = = 
(а) г 090 
2: 158. |3 | В: 8 Иа: Е 
га) сб м 
И 1 1 
И № 4 ИСД 
‚= ‚= ‚= 
7 |5 71615 7 |5 
"р 
БЕ | р 1926 
Е = 5 Е = 5 5 
(4) (4) ББ 
о. |28: |88 2 з и: 
се) 90) м 
И 1 И 
< 1 4 < 1 8 4 < 1 4 
= = = 
12156125 716 |5 716 |5 
2 | М. 
7а) 7 Ка 5 ~ ка) 
Е =6 = = — 
(4 22 { е 
в |з 2 |в |з 213 8 
се + я + 
И И 1 И 
$ 2 1 4 Э) Т. 1 4 Э 1 8 4 Э) 1 8 4 
‚= ‚= ‚= ‚= 
71615 6 |5 71615 7165 
| Ка) =5 
1 2 3 
2 8 |4 
= 
‚а 
71615 
27 
27 
0": 
Еа =7 и. Ка) =5 
1 2 3 1 2 3 
с о 
И И 
$ 7 8 4 $ 8 4 
Б ВЕБ е |н 
Рис Ошибка! Текст указанного стиля в 


8(а) = 0 


8(а) =1 


8(а) =2 


7 


8(а) =3 


8(а) =4 


8(а) =5 


документе 


отсутствует..33. Граф поиска для игры в 8 с оценочной функцией Г. 


3.2. СВОЙСТВА АЛГОРИТМА А* 


Алгоритм А* 


обладает целым рядом примечательных и 


полезных свойств, которые объясняют его широкую применимость. 
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Самым важным свойством является то обстоятельство, что, несмотря 
на эвристический характер алгоритма, известно достаточное” 
условие, при выполнении которого алгоритм А* гарантировано 
находит оптимальное решение, если оно существует. Это строго 
показано в первом параграфе данного раздела. Во втором параграфе 
показано, что алгоритм А*, образно говоря, «добро помнит» — чем 
более информирована предоставленная алгоритму оценочная 
функция, тем «лучше» ведет себя алгоритм. Наконец, в третьем 
параграфе раздела показано, что если оценочная функция выбрана 
разумно, если она согласована с метрическими свойствами 
пространства поиска, то алгоритм А* не только находит оптимальное 
решение в конце, но и все промежуточные состояния лежат на 
оптимальном пути. Другими словами, в некоторых случаях алгоритм 
А* ведет себя просто идеально: наилучшим возможным образом. В 
последнем параграфе мы констатируем, что идеальное поведение не 
всегда гарантировано: иногда А* оставляет желать много лучшего. 


3.2.1. Теорема о состоятельности 


Дадим необходимые определения и введем обозначения. Длину 
кратчайшего пути” 3 из узла 4, в узел 4› обозначим 5(а1, 4). Пусть 

ЕЖ(а) = 8*(а) + Аа) 

есть точная длина кратчайшего пути от узла 4 к узлу 4, 
проходящего через узел 4. Здесь е*(@) — длина кратчайшего пути от 
ак а, Һа) — длина кратчайшего пути от А к 4, то есть 2*(4) = 5(4х, 
4), һ*а) = 5(а, а,). 


° Условие именно достаточное, но не необходимое. Даже если 
условие не будет выполнено, алгоритм А* может найти решение, если 
повезет, но гарантировать этого нельзя. 


% Иногда в популярной литературе по ИИ эту величину называют 
расстоянием. Строго говоря, это некорректно, потому что расстояние 
должно быть симметричной функцией, а достижимость в орграфе вовсе не 
обязана быть симметричным отношением. 
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Исходя из определений, легко показать, что Уа Е*(4) > 5(4ь а,). 
Действительно, путь, составленный из двух кратчайших отрезков и 
проходящий через заданный узел 4, не может быть короче самого 
кратчайшего пути. Обозначим М = Е%(4,) = й*( 4) = 5(40, а) — это 
оптимум, длина кратчайшего пути, без всяких ограничений. 

Заметим, что функции ЁЕ*, о*, й* и число М нам, вообще говоря, 
неизвестны. 

Напомним, что мы рассматриваем оценочную функцию в 
следующей форме: 

Е(а) = 8(а) + Ща), 

где функция в — уже определена нами в процедуре Ореп. В 
процессе работы алгоритма А* для 82(4) справедлива оценка: 2(4) > 
2*(4), так как возможно еще не все пути построены, и при раскрытии 
узлов и построении новых путей оценка 2(4) может уменьшаться, но 
не может стать меньше е*(4). 

Под вопросом остается функция /(4) — эвристическая оценка 
расстояния от текущего положения до решения. Ясно, что в общем 
случае мы не можем математически точно указать эту функцию, 
мы можем только придумывать ее в каждом конкретном случае, 
более или менее удачно. Например, функция, выбранная в параграфе 0 
для игры в 8, оказалась очень удачной. Она позволила быстро найти 
решение. 

Насколько случайно это обстоятельство? Какими свойствами 
должна обладать оценочная функция, определяющая порядок 
раскрытия узлов, чтобы алгоритм гарантированно находил решение? 
Ответ на эти вопросы дает приведенная ниже теорема”. 


“ Эту теорему иногда называют теоремой о состоятельности 
алгоритма А*. Доказательство можно найти, например, в учебнике одного 
из авторов теоремы [13]. Приводимое здесь доказательство использует 
идеи авторов теоремы, но отличается структурой и обозначениями. 
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Говорят, что алгоритм поиска состоятеленОшибка! 
Закладка не определена. (или частично корректен), если он находит 
оптимальный путь, при условии что такой путь существует. 

Теорема. Если Уа (а) < А* (4), то алгоритм А* состоятелен. 

Доказательство теоремы основано на серии лемм. Все леммы 
доказываются при условии, что й<й* Лемма | и теорема 
доказываются при условии, что \УгеЕКР (т.м > 0), то есть вес 
применения правила строго положителен. Из этого следует, что по 
смыслу задачи все функции Ё*, в*, Й*, Е, ©, А и число М 
неотрицательны. 

Лемма 1. Если алгоритм А* не заканчивает свою работу, то 
оценка раскрываемого узла неограниченно возрастает. То есть УМ 
ЭК Е(а0) > №. 

Замечание. Здесь К — это номер шага алгоритма А*, а 4; — 
узел, раскрываемый на этом шаге. 

Доказательство. Пусть е = тір {гЕА | г.) > 0 — минимальный 
вес правила, а т=|К| — количество правил. Пусть р — глубина” узла 
Ак в дереве. Заметим, что самую меньшую глубину узел имеет, когда 
все ранее раскрытые узлы лежат на предыдущих ярусах дерева и при 
этом ярусы полностью заполнены. В предельном случае в р-1 ярусе 
т-ичного дерева в совокупности содержится 1+т-+т?+.. т?" = (т? 
О/т-Т) узлов. Следовательно, К < (т’-1)/(т-1) < т” (при т > 2). 
Тогда р > 102„к. Возьмем теперь К > т“. Имеем: Еа) > в(4) > ер>е 
102 > е 10° т\ = М. Ч.т.д. 

Лемма 2. Если существует оптимальный путь, то в списке 
открытых узлов всегда есть узел, принадлежащий этому пути, 
оценка которого не превосходит М. 

Доказательство. Пусть А = <4, ..., 4> — оптимальный путь. 
Далее индукция по шагам алгоритма. 


База индукции: 4 є Аи Еа) = й( 4) < А (а) = М. 


> Глубиной узла в корневом дереве называется число дуг на пути от 
корня до узла. 
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Индукционный переход. Открытие узла из А оставляет 
наследника в О. Значит, в списке О всегда есть узел из А, по меньшей 
мере один, но может быть и несколько. Пусть теперь 4'еЕ О, 4' є А, и 
4' — самый левый узел из таких узлов (см. Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..34), то есть все узлы левее 
а' на пути уже открыты и находятся в списке С. Тогда 2(4) = 2*(4?), 
поскольку отрезок оптимального пути также оптимален. Имеем Ё(а) = 
8(а)-а’) = э*(а’)-+а’ < э*(а')-+й*(а’) = Еа) = М, т.к. а є А Е*а) 
= М. Ч.т.д. 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..34. К доказательству Леммы 2. 

Лемма 3. Если существует оптимальный путь, то 
открывается всегда узел, оценка которого не превосходит М. 

Доказательство. По лемме 2 34 є О Е) < М, но функция 
бе1есії всегда выбирает минимум. Ч.т.д. 

Доказательство теоремы. Доказательство от противного за три 
шага. 

Первый шаг. Пусть ЗА — оптимальный путь и алгоритм не 
заканчивает свою работу. Тогда по лемме 1 ЗК Еа,) > М, что 
противоречит лемме 3. Значит, алгоритм заканчивает свою работу. 

Второй шаг. Алгоритм может закончиться с результатом ѓай или 
ОК. Результат ѓаћ возможен только если список О пуст. Но по лемме 
2 список О не пуст, значит, алгоритм заканчивается с результатом 
ОК. 
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Третий шаг. Пусть алгоритм А* закончил работу с результатом 
ОК, но найденный путь Р — не оптимальный путь. Рассмотрим 
последний вызов функции Ѕе1ес, перед тем как алгоритм закончил 
работу. Пусть функция Ѕе1есё выбрала в качестве раскрываемой 
вершины 4,. Но й*(а,)=0, следовательно /(0,)=0. Отсюда 

Е(а,) = 8(а)-+а,) = 8(а4,) > 8*(а,) = Еа) = М, 

то есть была выбрана вершина с оценкой больше М, что 
противоречит лемме 3. 

Таким образом, доказано, что алгоритм А* заканчивает работу с 
результатом ОК и находит при этом оптимальный путь. Ч.т.д. 

Следствие 1. Любая вершина АЕ О, для которой Еа) < М, 
будет раскрыта. 

Доказательство. Последним выбирается для раскрытия узел 4; с 
оценкой Ё(а,)=М, а на каждом шаге раскрывается узел с минимальной 
оценкой. Ч.т.д. 

Следствие 2. Поиск в ширину состоятелен. 

Доказательство. При поиске в ширину: Й = 0, Е = е, и 
выполнено условие состоятельности для й: 0 < й*. Ч.т.д. 

Рассмотрим пример с игрой в 8, приведенный в параграфе 0. 
Можно заметить, что предложенная эвристическая функция 
удовлетворяет условию состоятельности. Действительно, 
предложенная функция й — число шашек не на своем месте — не 
может превосходить числа шагов, которые нужны, чтобы поставить 
все шашки на свои места. Ведь за один ход мы ставим на место не 


более чем одну шашку! 
3.2.2. Сравнение оценочных функций 


Пусть даны две оценочные функции: 
Ека) = ва) + (а, 
Ра = 82(а) + №0). 


Причем выполнены условия теоремы о состоятельности: 


(а) < а), 
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(а) < ^а). 

Будем говорить, что функция /›(4) более информированная, чем 
й (4), если У4+41 (а) > (а). Пусть ^(4) — более информированная 
функция, чем й1(4). Тогда в случае применения Ё будет раскрыто не 
более узлов, чем в случае применения Ё, то есть более 
информированная оценочная функция быстрее находит решение. 

Как пример рассмотрим игру восемь, представленную в 
параграфах 2.1.4. и 0. В нашей терминологии 2(4) — глубина в дереве 
игры, й(4) — оценочная функция числа шашек не на своем месте. Так 
выбранная функция Й(4) в игре 8, очевидно, более информированная, 
чем функция /(4) при поиске в ширину (й=0). 

Теорема. Если существует оптимальный путь, и функция Р 
более информированная, чем функция Е, то к моменту окончания 
поиска всякий узел, раскрытый по Р, раскрыт и по Е1. 

Доказательство. Индукция по К — глубине узла 4 в дереве 
поиска по ЁР (Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..35). 

База индукции. Глубина равна нулю (4). В этом случае либо оба 
алгоритма раскрывают узел 45, либо оба не раскрывают (при 4 = 4). 

Индукционный переход. Пусть 4 — узел, выбранный для 
раскрытия по Р на шаге К. Пусть 5; и 5, множества раскрытых до 4 
узлов по Ё; и Е, соответственно. По индукционному предположению 
5; содержит узлов не меньше, чем 5, значит в 5, возможно больше 
узлов, из которых можно попасть в 4, чем в 5; (Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..35). Поэтому 21(4) < 2›(0). 
Далее от противного. Пусть алгоритм закончен и 4 не раскрыт по Ё}. 
По следствию 1 к теореме о состоятельности ЁР!(@) > М. Но по Ё узел 
а раскрыт, значит Р(4) < М. Имеем а1(а) + (4 > М > а2(а) + һа) > 
21(@) + №4), откуда (4) > й>(а), что противоречит условию. Ч.т.д. 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..35. К доказательству теоремы о сравнении оценочных 
функций. 

Рассмотрим еще раз пример с игрой в 8 в параграфе 0. Можно 
заметить, что предложенная эвристическая функция очень хороша: 
она не только удовлетворяет условию состоятельности, как показано 
в предыдущем параграфе, но она и «предельно информированная». 
Действительно, предложенную функцию й — число шашек не на 
своем месте — невозможно существенно улучшить, то есть, 
невозможно предложить эвристику Й’, такую, что Уай"а) > Ща). 
Действительно, из Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..33 видно, что бывают такие узлы 4, в которых Й(а) = 
һа), а значит гипотетическая мажоранта И’ нарушает условие 
состоятельности. 


3.2.3. Монотонное ограничение 


Говорят, что функция л удовлетворяет монотонному 

ограничению (или неравенству треугольника), если 
уа Аа < (г. Ка) т.м & а) = 0, 

где г — правило для перехода из узла а в узел и.Ка). 

Другими словами, эвристическая функция локально согласована 
с весом дуг (правил). 

Теорема. Если выполнено условие состоятельности, оценочная 
функция удовлетворяет монотонному ограничению и существует 
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оптимальный путь, то алгоритм А* всегда выбирает для раскрытия 
вершину, к которой уже найден оптимальный путь, т.е. (а) = ®*(4). 

Доказательство. Индукция по длине оптимального пути. 

База индукции: 2(4) = 24) = 0. 

Индукционный переход. Пусть выбрана для раскрытия вершина 
а = 4 и пусть А=4,, 4, ..., 4, ..., 4 — оптимальный путь. Имеем 

Уг а*(а)+А(а) < в*(а)+ихаьа а )+ан4) 

по монотонному ограничению. Далее 

4, АЕ А э 8*(а)+иха, 4-1) = (ан). 

Имеем 

УЕ оа) + Ща) < (а) + РА), 

и по транзитивности 

У 8* (4) + Аа) < 8*(а) + Ща). 

Пусть теперь д; — первая открытая вершина на пути А, т.е. 4; є 
А, 4 Е О & У] <К АЕ С. Такой узел существует, т.к. 40 Е С, 4Е О. Все 
вершины на пути А левее 4, т.е. все закрытые вершины, 
предшествующие д; на пути А, уже раскрыты, значит (4) = 2 *(4,). 

Так как алгоритм А* при раскрытии очередного узла из двух 
узлов 4 и 4; выбирает узел 4, то Р(а) < Е ар. Итак, имеем: 

(ча) = Ка) < Еа) = в(а)+ща») = 6 *а)+№а) < з*а)+Жа). 

Следовательно, 2(@) < 2*(4). Но\а (а) > р*(4) и значит 2(4) = 
2*(а). Ч.т.д. 

Следствие. Если оценочная функция удовлетворяет 
монотонному ограничению, то последовательность значений 
оценочной функции для выбираемых узлов не убывает. 

Доказательство. Пусть раскрыты узлы 4}, 4 (подряд). Если в 
момент раскрытия узла 4, уже 4 є О, то по построению А* имеем 
Е(а!) < Еа). Иначе 4 должен попадать в О при раскрытии 41. Имеем: 

Е(а) = 8(4>) + 0) = в*(4>) + 0) = в*(а1) + ихаь, 4) + 9) = 

= а(а1) + "(4 4.) + А) > #4) + Аа) = Еа)). Ч.т.д. 
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3.2.4. Область применимости алгоритма А* 


При всех своих достоинствах и заслугах алгоритм А* имеет 
целый ряд имманентно присущих ему особенностей, которые при 
определенных условиях могут проявлять себя как недостатки. 

1. В худшем случае алгоритм А* имеет экспоненциальные 
оценки сложности по времени и по памяти. Действительно, пусть в 
нашем распоряжении нет информированной оценочной функции, 
удовлетворяющей условию состоятельности. В таком случае придется 
применять поиск в ширину, ^=0. Допустим (худший случай!) что в 
любом состоянии все правила применимы, и пусть этих правил п. 
Пусть также количество дуг” на оптимальном пути от 4 к а, равно 5. 
Тогда, как нетрудно видеть, общее количество построенных узлов 
графа поиска составит не менее 1+и+и?...+и” "= (п? !—1)/(и—1). 

2. Эффективность алгоритма критическим образом зависит 
от эвристической функции Ё. Действительно, выше мы отметили, 
что, при отсутствии эвристики, алгоритм в худшем случае совершает 
количество шагов, экспоненциально зависящее от числа дуг 
оптимального пути. В то же время, если в нашем распоряжении есть 
предельно информированная оценочная функция, такая что 
Уа (А4 = й*(а)), и вдобавок выполнено монотонное ограничение, то 
алгоритм А* (в худшем случае!) построит и5+1 узлов, поскольку, по 
теореме предыдущего параграфа, в этом случае раскрываться будут 
подряд узлы на оптимальном пути. Таким образом, в случае 
идеальной?’ эвристики алгоритм А* может иметь трудоемкость, 
линейную по числу дуг оптимального пути. 

3. Алгоритм А* не учитывает структуру базы фактов и 
использует ее всегда целиком. Это чрезвычайно расточительно по 


% Речь идет именно о количестве дуг, а не о длине пути, т.е. не о 
сумме весов дуг. 


57 

Строго говоря, если И=й*, то функцию й уже нельзя считать 
эвристической, поскольку она совпадает с математически точной 
функцией И*. 
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памяти и для очень многих практических задач оказывается 
неприемлемым. Например, при решении задачи о движении робота в 
среде с препятствиями база фактов очень невелика — координаты 
текущего положения робота, и алгоритм А* показывает неплохие 
результаты. Но если А* применить в экспертной системе над большой 
реляционной базой данных, то формально говоря, каждому узлу в 
графе соответствует полный слепок (дамп) базы данных, причем 
соседние отличаются, может быть, только одной записью. 

4. Алгоритм А* не учитывает структуру условий в правилах 
и повторно вычисляет условия, которые, возможно, уже 
проверялись на предыдущих шагах. Это весьма расточительно по 
времени. В рассмотренном выше примере, при проверке положения 
робота, вычисления, выполненные для предыдущего положения, 
нельзя повторно использовать, поскольку координаты изменились. Но 
при проверке выполнения некоторого сложного условия для большой 
реляционной базы данных, 99% работы уже было выполнено при 
проверке этого условия в предыдущем состоянии, поскольку большая 
часть данных не изменилась. 

5. Алгоритм А* непригоден для случая динамического 
поиска. Действительно, если продукции, или цель, или веса правил 
могут динамически меняться в процессе поиска”, то все рассуждения 
предыдущих трех параграфов утрачивают силу. Состоятельность 
алгоритма А* основана на том, что выбор дальнейшего пути из 
некоторого узла не зависит от того, как мы попали в этот узел. В 
случае динамического поиска это не так: даже длина пути от 
текущего узла до целевого узла может быть различной в зависимости 
от того, как мы попали в текущий узел. 


* Конечно, при игре в 8 правила не могут меняться при движении 
шашек. Но при управлении войсками противник вполне может изменить 
свою тактику и стратегию по ходу боевых действий, например, введя в 
сражение новый вид оружия. 
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Сказанное в этом параграфе отнюдь не означает, что алгоритм 
А* никуда не годен и его не следует использовать. Совсем напротив, 
алгоритм А* — это лучшее известное решение, если нет никакой 
дополнительной конкретизирующей информации о свойствах задачи. 
Если же дополнительная информация есть, то А* можно и нужно 
модифицировать с учетом конкретной задачи. Одна из самых 
элегантных модификаций обсуждается в следующем разделе. 


3.3. ПОИСК НА ГРАФАХ И/ИЛИ 


При рассмотрении разложимых систем продукции было введено 
понятие графов И/ИЛИ. В таком графе вершины — это состояния 
базы данных или их части, которые получаются двумя способами: 
либо применением правила, либо разложением базы данных на 
составляющие. Это именно граф, а необязательно только дерево 
поиска. Одна и та же вершина 4 может появиться и в результате 
разложения 4 и применением правила к 4. Графы И/ИЛИ находят 
широкое применении в ИИ. Алгоритмы поиска, подобные А*, 
специализируются и уточняются для применения в случае графов 
И/ИЛИ. Кроме того, для отдельных частных случаев гиперграфов 
известны еще более эффективные алгоритмы. 


3.3.1. Граф И/ИЛИ 


Уточним определения. 

Граф И/ИЛИ — это гиперграф, то есть пара, состоящая из 
множества узлов {4} и множества К-дуг, причем К-дуга — это пара 
4—(4}, ...,а,), где а — начальный узел К-дуги, а {4,,...,4к} — множество 
концевых узлов. 

С точки зрения этого определения, обычный ориентированный 
граф — это гиперграф, в котором каждая дуга — это 1-дуга. Так же 
как и в обычном орграфе, в гиперграфе можно определить понятие 
пути (гиперпути). 

Гиперпуть в гиперграфе — это последовательность множеств 


узлов, <5, .., „>, причем для каждого узла 4є$%, 1<1<п-, 
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существует ровно одна К-дуга 4—4), ...,4,), такая, что И1<] <к 
(4;є5;.1). 

Определение гиперпути является прямым обобщением 
определения пути, но гиперпуть в гиперграфе будет выглядеть как 
граф, а не как одна чередующаяся последовательность узлов и дуг. Из 
каждой вершины выбирается ровно одна К-дуга. Из каждой 
полученной вершины снова выбирается ровно одна К-дуга т.д. 

Среди всевозможных гиперпутей нам интересны те, которые 
начинаются в исходном состоянии базы данных и заканчиваются в 
терминальных состояниях. 

Граф решения С(40, Т) — это гиперпуть из 4 во множество 
терминальных узлов Т. 

Можно дать эквивалентное рекурсивное определение графа 
решения С(4, Т): 

1. Если а Е Т, то С = 4. 

2. Если 4 # Т, и из Я исходит К-дуга 4—а1ь...,4), причем 
существуют графы решения С, ©, ..., С; для узлов А, 4, ..., 4, то 

(= 4-—>(а1.....Аю) ©, С (4... С р 

Стоимость (вес) графа решения (то есть длина пути в 
гиперграфе) определяется с помощью индуктивного определения: 

и(а(а,Т)) = м(4—(4,...,4,)) + У м(С(а,Т)). 

Таким образом, одна и та же К-дуга при подсчете длины может 
учитываться много раз. 

Рассмотрим пример (Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..36). Положим, что узлы 5 и 6 терминальные, а 
узел 0 начальный. Можем утверждать, что здесь имеются два графа 
решения (на рисунке они обведены). 
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с(К-дуга)=К 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..36. Гиперграфы решения и А-дуги 

Если считать, что длина К-дуги равна К, то 

- длина первого графа решения = 1+(2+(2)+(2)) =7, 

- длина второго графа решения = 2+(2+(1+2)) =7, 

так как согласно индуктивному определению некоторые К-дуги 
могут учитываться несколько раз. 


3.3.2. Алгоритм поиска на графе И/ИЛИ 


Для поиска путей в гиперграфе существуют алгоритмы, 
обобщающие обходы в глубину и в ширину на обычных графах. 
Принципиальным отличием обобщающих алгоритмов является то, 
что при достижении отдельного терминального узла процедура 
поиска не останавливается. Нам нужно не просто достичь отдельного 
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терминального узла, а построить граф решения, все ветви которого 
заканчиваются в терминальных узлах. 

Вообще говоря, алгоритмы поиска на графе И/ИЛИ могут 
работать без дополнительной информации. Однако при наличии 
оценочной функции могут быть использованы алгоритмы 
эвристического поиска. 

Алгоритм эвристического поиска на графе И/ИЛИ заключается 
в следующем. 

Пусть граф ациклический, имеется оценочная функция Ё, и л 
удовлетворяет условию монотонности (монотонному ограничению): 

ма < "ха, (ар, ...,Ак)) + У №) 

и условию состоятельности (то есть является нижней оценкой 
точного решения): 

(а) < А*(а). 

Процедуры поиска на графах И/ИЛИ определяются следующим 
образом. 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..11. Основная процедура поиска на графе И/ИЛИ. 
ргос С5 и/или (4, В, Т) 

С := А {частичный граф решения} 

$ (4) := 4 є Т {отметка узла} 

Е (95) == 090) 

мһі1е —5 (4) Яо 


Я := Ѕбе1Іесі (С) 
1Е р = п11 іёҺеп гебагпр (Ёа11) епа 1Е 
Ореп (а, б) 


епа мһі1е 
епа ргос 


Здесь ѕ (а): Боо1 — отметка узла, обозначающая, найден ли 
для этого узла гиперпуть, ведущий в терминальные вершины. Если 
з (а) =Екче, гиперпуть найден, то узел называется разрешенным (от 


английского слова ѕоІуед). 
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Процедура Ѕе1есі на основе построенного графа поиска 
рассматривает частичный граф решения и выбирает для раскрытия на 
этом графе нераскрытый узел минимальной стоимости. 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..12. Процедура выбора узла для раскрытия. 
ргос эе1есе (С) 

© ее аз 

Ғог Че О ао 

Ғог а = (9>4.,.., ак) є о(а) до 
1Е х(а->а!,.., Ак) ЕВеп {дуга отмечена} 


О:=О - {4} {удаляем начальный} 
О:=О + ({а1,....@ак}\Т) { концевые } 
епа 1Е 
епа Ғог 
епа Ғог 
т := < 
а’ := рпі 


Ғог а є О ао 
1Е Ғ (а) <м +Һеп 
а := а 
ш := Е(а) 
епа 1Е 
епа Ғог 
геёигп (а’) 


епа ргос 
Здесь О — концевые вершины частичного графа решения, 
о (а) — множество дуг узла а, х (4) — отметка дуги а. 


В этой процедуре фактически каждый раз заново прогоняется 
фронт решения от 4, к концевым вершинам по отмеченным -дугам. 

Процедура Ореп значительно сложнее. Она раскрывает 
выбранную вершину, пересчитывает оценки вершин, отмечает &-дуги 
и отмечает разрешенные вершины, то есть вершины, для которых 
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найден гиперпуть в терминальные вершины. Эти изменения могут 
затронуть весь граф. 
Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..13. Процедура Ореп. 
ргос Ореп (а,С) {раскрытие вершины} 
Ғог гє В Яо 
1Е г.р(а) ЕБеп 
С := 6 + (аә а,,.., а) 
Бог і Ғгот 1 +о К Яо 
1Е ая С +һеп Е(а,) :=6 (4;) епа іғ 
$ (4;) := Я; є Т 
епа Ғог 
епа 1Е 
епа Ғог 
{ Пересчет оценок и отметок} 
Са] 
мһі1Іе С + © ао 
{выбор вершин для пересчета} 


Ғог а’еЕ С ао 
1Е Р(а’) пм С = © +һеп а:=а’ епа іғ 


епа Ғог 
Сао та} 
т := о 


Бог а= (а а,,.., 4) є 0(а) ао 
м’ :=м (а) + У Е(а;) 
1Е и’ < т ЁҺеп 


х(а(а)) := Еа1зе 
х (а) := гче 
з (а) :=&з (а;) 
т := м’ 
епа 1Е 


1Е ѕ (а) у Е(а) т +Һеп 
Е (а) :=м 
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О ме) 
епа 1Е 
епа мһі1е 
епа ргос 


Здесь используются следующие обозначения. 


О (а) — множество исходящих из а дуг (в С), 

Р (а) — множество потомков Я в С, 

а(а) — отмеченная дуга из а, 

х (а) — отметка дуги, 

О (а) — множество предков а в С вдоль отмеченных дуг, 

5 (а) — отметка узла, означающая что из него построен 


гиперпуть до цели. 

Повторим еще раз основные выводы по этим трем процедурам. 
Процедура С5$ и/или попеременно вызывает процедуры Зе1есе и 
Ореп пока либо окажется так, что никакой узел не найден для 
раскрытия (результат #а11), либо исходный узел Чо окажется 
разрешенным. Процедура Ѕе1есі строит фронт текущего частичного 
графа решения по отмеченным дугам и выбирает узел с наименьшей 
оценкой в этом фронте. Процедура Ореп сначала раскрывает 
выбранную вершину, а затем пересчитывает оценки узлов, отмечает 
дуги и вершины. При этом данная процедура может переоценить весь 
граф. В этих процедурах мы считаем, что понятие правила обобщает 
как применение правила, так и расщепление базы данных с помощью 
К-дуги. 


3.3.3. Пример применения процедуры поиска на графе 
И/ИЛИ 


На Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..37 — Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..41 приведен пример работы алгоритма поиска на графе 
И/ИЛИ применительно к графу, представленному на Рис. Ошибка! 
Текст указанного стиля в документе отсутствует..36. 
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На этих рисунках используются следующие обозначения. 
Состояния базы, то есть узлы графа И/ИЛИ, обозначаются кружками. 
Если кружок закрашен, то это означает, что для него получено 
условие з (а) = 1, то есть найден граф решения из данного узла в 
терминальные узлы (которыми в данном примере являются узлы 5 и 
6). 1-дуги обозначаются обычными стрелками, К-дуги (в этом примере 
К=2) обозначаются более плотными стрелками и имеют небольшую 
черточку, соединяющую ветви ќ-дуги. Число рядом с узлом является 
текущей оценкой этого узла. При этом считается, что функция й для 
терминальных узлов имеет значение 0, а для всех остальных — 1. 
Такая функция удовлетворяет условию состоятельности, очевидно. 
Длина К-дуги равна К. Отмеченная дуга, исходящая из данного узла, 
отмечена жирной полоской. Следующая серия рисунков образует 
пояснение к процедурам поиска на графе И/ИЛИ. 


Ро 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..37. Шаг 1. Начальное состояние 

В начальном состоянии граф решения состоит из единственного 
узла 4, этот же узел образует фронт решения, именно его выбирает 
функция Ѕе1есі, потому что больше выбирать некого, а процедура 


Ореп раскрывает этот узел. 
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2% 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..38. Шаг 2. Первое раскрытие узла 

После первого шага при пересчете оценок в узел 4 
возвращаются: 
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- слева = 1 (оценка узла 41) + 1 (стоимость дуги 44) = 2; 

- справа = 1 (оценка узла 4) + 1 (оценка узла 43) + 2 (стоимость 
дуги 4—(45,з) ) = 4. 

Оценка слева предпочтительнее, поэтому отмечается дуга 


44} и следующим будет открываться узел а). 
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Рис Ошибка! Текст указанного стиля в документе 
отсутствует..39. Шаг 3. Второе раскрытие узла 

После второго шага при пересчете оценок в узел 4 
возвращаются: 

- слева = 1 (оценка узла 44) + 1 (оценка узла 4) + 2 (стоимость 
дуги 41—>(44,4) ) + 1 (стоимость дуги 4—4!) = 5 — оценка возрастает; 

- справа = 1 (оценка узла 4) + 1 (оценка узла 43) + 2 (стоимость 
дуги 4-—>(4,43) ) = 4 — оценка не меняется. 

Теперь оценка справа предпочтительнее, поэтому отмечается 


дуга 4—>(4,43), и следующим будет открываться узел 4. 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..40. Шаг 4. Третье раскрытие узла 

После третьего шага мы попадаем в терминальные узлы 4$, 4$. 
Поскольку это оба узла, в которые ведет 2-дуга 4—(45,4), узел 4 
также отмечается как разрешенный. При этом его оценка равна 2 
(стоимость исходящей 2-дуги). При пересчете оценок в узел 4 
возвращаются: 

- слева = 1 (оценка узла 44) + 1 (оценка узла 4) + 2 (стоимость 
дуги 4,—(44,9,) ) + 1 (стоимость дуги 4—4!) = 5 — оценка не меняется; 

- справа = 2 (оценка узла 4) + 1 (оценка узла 43) + 2 (стоимость 
дуги 4—>(45,43) ) = 5 — оценка не меняется, а потому отметка дуги 
4—>(4›,4з) сохраняется. 

Следующим будет открываться узел 443. 
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Рис Ошибка! Текст указанного стиля в документе 
отсутствует..41. Шаг 5. Построение графа решения 

На последнем шаге открывается узел 4. Поскольку дуга 4—4 
ведет в уже разрешенный узел, узел д3, а за ним и узел 4 получают 
отметку 5=1. При пересчете оценок в узел 4 возвращается: 2 (оценка 
узла 44) + 3 (оценка узла 43) + 2 (стоимость дуги 4&—>(4,4) ) = 7. 
Работа алгоритма завершена. 


3.4. ПОИСК НА ИГРОВЫХ ДЕРЕВЬЯХ 


Идея поиска на графах И/ИЛИ особенно широко применяется 
при программировании интеллектуальных игр. В этом случае обычно 
рассматривается особый частный случай графа И/ИЛИ, который 
называется игровым деревом. 


3.4.1. Игровые деревья 


Допустим, имеется антагонистическая (есть соперник) 
дискретная (число позиций не более чем счетное) игра с полной 
информацией (все правила заранее известны и позиция открыта). В 
ней принимают участие два игрока Мах и Мт, которые ходят по 
очереди, причем Мах ходит первым. 
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Попробуем составить выигрышную стратегию для игрока Мах. 
Для этого построим граф поиска, узлами которого будут допустимые 
позиции игры. В этом графе дуга ведет из узла, соответствующего 
позиции А, в узел, соответствующий позиции В, если В получается из 
А применением некоторого правила игры к позиции А. Корню дерева 
соответствует начальная позиция игры, а листьям — позиции, в 
которых однозначно определен исход игры (т.е. определен 
победитель или зафиксирована ничья). Тогда задача определения 
выигрышной стратегии для игрока Мах сводится к поиску пути в 
дереве игры от корня к листу, соответствующему позиции, победной 
для Мах. Причем из позиции для некоторого хода Мах достаточно 
найти хотя бы одну разрешимую вершину (потому что мы составляем 
стратегию для игрока Мах и можем выбрать тот ход, который хотим), 
тогда как для хода М все потомки должны быть разрешимыми 
(потому что мы не можем повлиять на выбор хода игроком Міп и 
должны принимать во внимание все возможные ходы). Таким 
образом, дерево игры является графом И/ИЛИ с 1-дугами из узлов для 
первого игрока Мах (И) и К-дугами из узлов для второго игрока Міп 
(ИЛИ). 

Правилами игры задана оценка Ё* всех конечных позиций: Ё* = 
+ос если победил Мах, Е* = –ос если победил Мш и Ё* = 0 если игра 
закончилась вничью. 

Обычно игру представляют не просто графом И/ИЛИ, а именно 
гипердеревом, так что в каждую позицию, кроме начальной, входит 
ровно одна дуга. При этом, очевидно, может происходить некоторая 
потеря памяти, потому что совпадающие позиции, которые 
получились в результате различных последовательностей ходов, 
будут храниться в нескольких экземплярах. Однако практические 
наблюдения показывают, что в наиболее распространенных 
интеллектуальных играх такие ситуации встречаются сравнительно 
редко. С другой стороны, для игровых деревьев предложено 
несколько весьма эффективных алгоритмов поиска решения (см. 
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следующие параграфы), которые не применимы к графам общего 
вида. Поэтому при программировании интеллектуальных игр обычно 
жертвуют памятью ради повышения быстродействия алгоритмов. 
Рассмотрим в качестве примера упрощенную игру Ним”. В 
кучке лежит пять монет. За ход разрешается взять одну, две или три 
монеты. Пропускать ход нельзя. Проигрывает тот, кто берет 
последнюю монету. Нас Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..42 приведено полное дерево игры. Под 


терминальными позициями подписано, кто выиграл. 


Я 


Рис Ошибка! Текст указанного стиля в документе 
отсутствует..42. Дерево игры Ним 


> Эта игра попала в Европу в ХУІ веке из Китая. Имя «ним» было 
дано игре американским математиком Чарльзом Бутоном (СВатез Вошоп), 
описавшим в 1901 году выигрышную стратегию игры. В классическом 
варианте игры есть три кучки монет, за один ход может быть взято любое 
количество монет (большее нуля) из одной кучки, и выигравшим считается 
игрок, взявший последний предмет. 
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3.4.2. Минимакс 


Один из алгоритмов поиска решения на игровых деревьях 
известен как метод Минимакс (МииМах), предложенный еще в 1945 
году О. Моргенштерном (О. Могсепуегп) и Дж. фон Нейманом (7. уоп 
М№Мештапп). Дж. фон Нейман наиболее известен как праотец 
современной архитектуры компьютеров (архитектура фон Неймана), а 
также как создатель теории игр и концепции клеточных автоматов. 

Если бы у нас было полное дерево игры, мы бы начали снизу, с 
терминальных вершин, оценка которых задана правилами игры 
(функция Ё* для терминальных позиций), и все было бы достаточно 
просто — для хода игрока Мах мы выбираем дочернюю вершину с 
максимальным значением оценочной функции, и переносим эту 
оценку вверх, а для хода Міп — с минимальным. Если в результате 
работы алгоритма начальная вершина имела бы оценку +5, то 
победил Мах, если ос, то Ми. Таким образом, игра была бы решена. 

Например, на Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..42 рядом с узлами написаны статические оценки, 
полученные указанным образом. На рисунке видно, что в данной 
простой игре М всегда может выиграть, если будет правильно 
играть. 

Но полное дерево игры обычно слишком велико. К примеру, для 
шашек это 10* позиций, а для шахмат — 10'° (параграф 1.1.8). Для 
практически интересных игр полное дерево игры построить 
физически невозможно. Но можно эту идею (начать снизу) применить 
и к частичному дереву. Для этого нужно построить частичное дерево, 
оценить узлы на нижнем ярусе при помощи оценочной функции, и 
вернуться по дереву назад, т.е. вверх. 

Метод Минимакс заключается в следующем. Пусть есть 
некоторая статическая оценочная функция позиции Ё, причем если 
позиция считается выгодной для Мах, то Е>0, если позиция 
считается выгодной для М, то Е < 0. Если бы Мах выбирал среди 


концевых вершин, то он выбирал бы позицию с наибольшей оценкой, 
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а если выбирал бы Мш, то — с наименьшей оценкой. Также и в 
методе Минимакс. В построенном частичном дереве игры (если 
полное дерево построить невозможно) листовые позиции 
оцениваются придуманной оценочной функцией (поскольку правила 
игры не предусматривают оценку промежуточных позиций), а далее 
вверх по дереву распространяются оценки в точности так, как это 
делается при статической оценке полного дерева. Если оценочная 
функция придумана удачно, а дерево построено достаточного 
глубоко, то метод Минимакса часто дает действительно оптимальное 
решение, или решение, близкое к оптимальному. 

Рассмотрим в качестве примера игру в крестики-нолики на 
доске 3х3. Игроки по очереди ставят в пустые клетки крестики и 
нолики. Выигрывает тот, кто первым поставит три своих значка 
подряд: в одной горизонтали, вертикали или диагонали. 

Применение метода Минимакс с глубиной частичного дерева 
игры равной 2 приведено на Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..43 («крестики» обозначены цифрами 1, а 
«нолики» — цифрой 0). Число после знака «=» в позиции — это ее 
оценка. 
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Е = число своб. линий для 1 
минус число своб. линий для 0 


1-- Е 2 2. а 
ЕЕ 1-- -1- 
= -1 = -2 = +1 
1-- 1-- 1-- 1-- 1-- 0-- -0- --0 == === 0-- -0- 
0== | === | === | === | -0- | 1-- | 1-- | 1-- | 1-0 | 10- | -1- | -1- 
=== 0-- -0- --0 === --- = Ее == ас = --- 
= +11 = 0 |= +1 0 = -1 0 = 0 -2 +] +2 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..43. Часть дерева игры крестики-нолики 

Мы видим, что наилучшим ходом для Мах при оценке по 
методу Минимакс с глубиной 2 оказывается ход в центральную 
клетку. Как нетрудно сообразить, это действительно выигрышная 
стратегия для Мах. 

Однако далеко не всегда метод Минимакс может выбрать 
действительно лучший или даже хороший ход, все зависит от того, 
насколько удачно составлена оценочная функция. Рассмотрим в 
качестве примера небольшое усложнение игры Ним из предыдущего 
параграфа. Пусть допустимые ходы и условие окончания остаются 
теми же, а исходное число монет не фиксировано и равно п. Нам 
нужно придумать оценочную функцию. Обычно это делается на 
основе наблюдений. Рассмотрим Рис. Ошибка! Текст указанного 
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стиля в документе отсутствует..42 в качестве базы наблюдений. Мы 
видим, что при п = 1 Мах проигрывает, при п = 2, 3, 4 Мах 
выигрывает, а при и = 5 снова проигрывает. Значит, при п =Т1ип=5 
оценочная функция должна быть отрицательна, а при п = 2, 3, 4 — 
положительна. Возникает искушение подобрать по возможности 
простую формулу, согласующуюся с наблюдательными данными, и 
объявить ее «законом природы», в данном случае — оценочной 
функцией”. Искушение становится просто непреодолимым, как 
только из глубины памяти всплывают остаточные знания курса 
школьной алгебры. Действительно, функция имеет, по меньшей мере, 
два корня, один между 1 и 2, а второй между 4 и 5. Как учили в 
школе, рассмотрим произведение (и – 1,5)(и – 4,5) и после округления 
функцию Р(и) = —и?+6бп 7, которая демонстрирует желаемое 
поведение, полностью согласованное с имеющимися наблюдениями: 
ЕСГ) = 2, Е(2) = +1, Е(3) = +2, Е(4) = +1, Е(5) = 2. Применим эту 
оценочную функцию в методе Минимакс для игры Ним при и=7 с 
раскрытием дерева на глубину 2 (Рис. Ошибка! Текст указанного 
стиля в документе отсутствует..44). На этом рисунке указаны 
исходные оценки, заданные выбранной функцией, вычисленные 
оценки по методу Минимакс, и утолщены стрелки ходов, которые 


выбирает метод. Мы видим, что метод подсказывает правильный ход! 


60 Читателю, который не потерял интереса к нашему примеру, мы 
настоятельно рекомендуем в этом месте прервать чтение и самостоятельно 
решить задачу. Мы даже подскажем ответ: Мах проигрывает тогда и 
только тогда, когда и той 4 = 1. 
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Е=- Е=+1 Е=+2 Е=+1 Е=+2 Е=+1 Е=- Е=- вк 

Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..44. Удачное применение метода Минимакс в игре Ним 

Однако, если мы попытаемся экстраполировать оценочную 
функцию и выйти за пределы исходной наблюдательный базы, мы 
получим совсем негодный результат. На Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..45 представлено дерево 
для случая и = 10 в тех же обозначениях, что и на Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..44. Минимакс дает плохой 
совет, а тот ход, который на самом деле выигрывает, по методу 
Минимакс оценивается как худший! 


Выигрывающий пах=-7 
ход! ~. 


Е=-23 Е=-14 Е=-7 Е=-14 Е=- Е=- Е=- Е=-2 Е=+1 


Рис Ошибка! Текст указанного стиля в документе 
отсутствует..45. Неудачное применение метода Минимакс в игре Ним 
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3.4.3. а-В отсечение 


В Минимаксе порождение позиций и их оценка отделены друг 
от друга. Сначала происходит порождение, а только потом это 
порождение оценивается. Можно производить одновременную 
оценку прямо во время порождений, чтобы не порождать ничего 
лишнего. Такая процедура называется ©-В отсечение. 

Этот механизм, видимо, был настолько необходим и актуален в 
середине ХХ века, что его разработками занялись многие ученые по 
всему миру. Сейчас сложно сказать, кто является автором этой 
процедуры, судя по всему, она изобреталась неоднократно. Самуэль 
(А. Затие]), Ричардс (О.Т. Кісһагаѕ), Харт (Т.Р. Нагі) и другие 
независимо предлагали ранние версии этого алгоритма. Джон 
Маккарти (7. МсСагіћу) так же выдвигал подобные идеи на 
Дармудском семинаре в 1956 году. Наш соотечественник Александр 
Львович Брудно независимо открыл алгоритм и опубликовал свои 
результаты в 1963 году. 

Рассмотрим простой модельный пример, поясняющий основную 
идею 0-8 отсечения. Пусть имеется некоторая игра, поддерево 
поиска которой имеет вид как на Ошибка! Источник ссылки не 
найден. (слева). Предположим, мы раскрыли и оценили только левое 
поддерево рассматриваемого узла (в нем есть единственная позиция, 
и ее оценка равна 7). Поскольку игрок Мах всегда выбирает узел с 
наибольшим значением оценочной функции, то в независимости от 
нераскрытого поддерева справа оценка корневой позиции будет > 7. 
Теперь рассмотрим выбор хода для игрока М (Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..46, справа). Пусть из двух 
возможных позиций раскрыта только одна (ее оценка 4). Так как 
игрок Міп выбирает узел с наименьшим значением функции, то 


оценка выбранного хода будет < 4. 
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МАХ 7 МІМ 
МІМ Ө МАХ ) о 


МАХ ® ©® МИМ№ | ө 


Рис. Ошибка! Текст указанного стиля в документе 


отсутствует..46. Поддеревья некоторой игры 
Продолжим эти рассуждения и рассмотрим Рис. Ошибка! Текст 


указанного стиля в документе отсутствует..47. 
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Рис. Ошибка! Текст указанного стиля в документе 


отсутствует..47. Пример отсечения поддерева некоторой игры 

После рассмотрения правого поддерева узла, соответствующего 
ходу Мш, известно, что его оценка не превзойдет 4. Однако при 
рассмотрении части левого поддерева оказывается, что оценка его 
корня будет >7. Это значит, что проводить дальнейшее раскрытие 
узлов в левом поддереве не имеет смысла, так как у игрока Мт уже 
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есть заведомо лучший вариант. Поэтому происходит отсечение 
оставшейся части левого поддерева. 

Приведенный пример формализуется следующим образом. 

Пусть о — граница снизу для значения оценки в данном узле, 
В — граница сверху для значения оценки в данном узле. 

Заметим, что значение а для Мах узла не могут уменьшаться, а 
значение В для Мт не могут увеличиваться при любом раскрытии 
узлов. Следовательно, имеют место следующие правила. 

1. Можно не искать из данного узла Мт, если его верхняя 
оценка В меньше или равна нижней оценке © для любого его Мах 
родителя. 

2. Можно не искать из данного узла Мах, если его нижняя 
оценка © больше или равна верхней оценке В для любого его Міп 
родителя. 

Обратите внимание, что формульная запись проверяемого 
неравенства для отсечения формально одна и та же: в первом случае В 
< а, во втором случае а > В, но смысл эти формулы имеют 
различный. 

В первом случае, для узла Мш, мы берем только что 
полученную оценку В и сравниваем ее с оценками @ для 
вышележащих узлов Мах. Во втором случае, для узла Мах, мы берем 
только что полученную оценку © и сравниваем ее с оценками В для 
вышележащих узлов Мт. Но в обоих случаях выполнение 
неравенства является основанием для отсечения. 

Пример для игры в крестики-нолики приведен на Рис. Ошибка! 


Текст указанного стиля в документе отсутствует..48. 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..48. о-В отсечение для игры в крестики-нолики 

Порождение и оценивание производятся следующим образом. 
Сначала производится порождение трех узлов второго уровня. Потом 
производится порождение пяти узлов третьего уровня в левом 
поддереве и получается оценка —1 для узла второго уровня. При этом 
можно для корневого узла первого уровня сразу определить нижнюю 
оценку а = —1. Далее начинается порождение узлов третьего уровня в 
среднем поддереве. Первый же узел имеет оценку -—1, что дает 
верхнюю оценку В = –1 и выполнение неравенства отсечения. Мы 
видим, что четыре узла на третьем уровне можно не порождать — их 
порождение не изменит оценки остальных узлов. В правом поддереве 
никакого отсечения не происходит — неравенство не выполняется. 
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3.4.4. Эффективность о-В -отсечения 


Насколько эффективно @-В отсечение? Попробуем ответить на 
этот вопрос. В разобранном примере мы сэкономили 4 узла из 16, или 
25% работы. Является ли этот показатель предельным? Всегда ли он 
достигается? 

Сначала ответим на второй вопрос, он более простой. Ответ: 
нет, не всегда. Действительно, пусть (худший случай!) дочерние узлы 
для узла М порождаются в порядке убывания, а для узла Мах в 
порядке возрастания. Например, если на Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..48 узлы третьего уровня в 
среднем поддереве будут порождены в таком порядке: 0, 0, —1, —1, —2, 
то отсечены будут только два узла (12,5% экономии), если оценочная 
функция будет неудачна и даст оценки 0, 0, 0, 0, 0, то вообще 
никакого отсечения не произойдет. 

Теперь ответим на первый вопрос: что может дать о-В отсечение 
в наилучшем случае. Пусть глубина рассматриваемого дерева (без 
отсечений) равна йл, а каждый узел имеет ровно 4 сыновей. Тогда 
внизу имеется ровно М№=Д” узлов. Пусть (наилучший случай!) 
вершины для узлов Мт порождаются в порядке возрастания, а для 
Мах — в порядке убывания значений оценочной функции. 

Тогда можно показать, что при использовании о-В отсечения 
число порожденных узлов будет равняться: 

24"'? если ћ четно 


№ = 0(4'!?) = 
ао 417 1/? — |, если А нечетно 


Поэтому ответ на наш вопрос таков: в идеальном случае а-В 
процедура позволяет удвоить глубину поиска по сравнению с 
Минимаксом, и в любом случае дает результат не хуже. 

Таким образом, мы видим, что порядок порождения позиций и 
порядок рассмотрения ходов являются одним из ключевым факторов 
программирования интеллектуальных игр. К сожалению, (а может 
быть, и к счастью?) никаких общих методов ранжирования ходов не 


существует. Методы перебора во всех игровых программах примерно 
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одинаковы и близки к изложенным (давно опубликованным и хорошо 
изученным), а вот эвристики порядка рассмотрения ходов для каждой 
игры свои (и составляют ноу-хау автора игровой программы). 

Практика показывает, что сила игры программы прямо 
пропорциональна глубине поиска. Например, начинающий шахматист 
редко просматривает позицию больше чем на три-четыре полухода 
вперед. Т.е. глубина дерева поиска у новичка примерно 3. Шахматные 
мастера строят в уме дерево на дюжину полуходов, а если намечается 
форсированный вариант, то и больше. Гроссмейстеры и чемпионы 
видят еще дальше, на два десятка полуходов. Находясь в 
миттельшпиле, они уже могут предсказать эндшпиль. 

Современные шахматные программы, используя резко 
возросшие возможности компьютеров, строят и оценивают огромные 
игровые деревья, включающие миллионы позиций. Каким же образом 
люди еще иногда не проигрывают компьютерам в шахматы?! Дело в 
том, что шахматист-человек строит в уме гораздо более узкое дерево. 
В сложной шахматной позиции сильный шахматист сразу видит 2-3 
наилучших хода из двух десятков возможных ходов и только их 
анализирует и просчитывает в глубину. А шахматная программа, 
даже применяя наилучшие известные приемы, подобные о-в 
отсечению, отбрасывает в среднем только половину возможных 
ходов. Если условно принять, что у человека ширина ветвления в 
дереве игры постоянна и равна 2, а у программы постоянна и равна 
10, то для поиска методом Минимакса на глубину 10 человеку нужно 
просмотреть 2'' = 2048 позиций, а программе 10'' = 100 000 000 000 
позиций. 


°' Кстати, не проигрывают уже только гроссмейстеры и чемпионы. 
Средний любитель шахмат проиграет лучшей современной шахматной 
программе с вероятностью 100%. Даже Каспаров уже проигрывает, дальше 
будет только хуже! Можно утверждать, что в скором времени 
соревнование человека (любого!) с программно-аппаратным комплексом в 
шахматах станет бесперспективным! 
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ВЫВОДЫ ПО ГЛАВЕ 3 


1. Существует большое количество алгоритмов поиска решения, 
в том числе и для систем продукций. Каждый из алгоритмов имеет 
область применимости, где он наиболее эффективен и полезен. 

2. В искусственном интеллекте применяются эвристические 
алгоритмы поиска решения, причем эффективность алгоритма 
критически зависит от качества оценочной функции, которая 
собственно и определяет эвристику. 

3. Для представления пространства поиска чаще всего 
используются ориентированные графы и графы (деревья) И/ИЛИ. 


ГЛАВА 4. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ 
ФОРМУЛАМИ ИСЧИСЛЕНИЯ ПРЕДИКАТОВ 


Материал этой главы базируется, в основном, на 
математической логике, основные понятия которой считаются 
известными читателю. Тем не менее, все необходимые определения и 
некоторые теоремы кратко повторяются в первых разделах. И все- 
таки, мы хотим предуведомить читателя, что эта глава никак не 
является кратким учебником по математической логике. Многие 
важные, интересные и технические сложные теоремы и понятия 
формальной математической логики здесь либо опускаются, либо не 
доказываются, либо даются в упрощенной формулировке. Причина в 
том, что мы в этой главе рассматриваем математическую логику и ее 
основные объекты — логические исчисления — ни в коем случае не 
как цель, а только как средство представления знаний в компьютере. 
Наше отношение к высокому искусству математической логики в 
этой главе крайне прагматично: мы просто используем готовый язык 
и аппарат, не задумываясь о том, какой ценой он достался 
человечеству. Естественно, применение логических исчислений в ИИ 
рассматривается исключительно на конкретных примерах. 
Формальные построения в основном тексте главы сведены к 
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минимуму. Читателя, которому формальные построения необходимы, 
мы отсылаем к классическому учебнику [19]. 


4.1. МЕТОД РЕЗОЛЮЦИЙ 


Представления знаний с помощью логических формул 
базируется на следующей идее. Мы будем строить определенные 
формальные теории, проводить в них поиск формальных 
доказательств и интерпретировать полученные результаты в 
предметной области, где работает интеллектуальная программа. В 
качестве формальных теорий мы используем прикладные исчисления 
на базе исчисления предикатов первого порядка, а в качестве метода 
поиска доказательства — метод резолюций. Существует, и с успехом 
применяются, другие классы формальных теорий и другие методы 
поиска доказательства, и мы указываем на них в дополнениях и в 
отступлениях, но в основном тексте мы главы мы ограничиваемся 
этим классическим случаем. 


4.1.1. Формальные теории 


Исторически понятие формальной теории было разработано в 
период интенсивных исследований в области оснований математики 
для формализации собственно логики и теории доказательства. 
Огромный, может быть, решающий вклад в становление и развитие 
аппарата формальных теорий внес выдающийся немецкий математик 
Давид Гильберт. Сейчас этот аппарат широко используется при 
создании специальных исчислений для решения конкретных 
прикладных задач в области ИИ. Давид Гильберт писал: «Теория 
доказательства ... дает нам возвышенное чувство убеждения в том, 
что, по крайней мере, для математического ума не поставлены 
никакие границы, и что он сам в состоянии проследить законы 
собственного мышления...». 

Используемое нами далее исчисление предикатов является 
примером формальной теории, поэтому мы начнем с краткого 
описания общего понятия формальной теории. 
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Формальная теория — это структура, имеющая следующие 
четыре необходимые составляющие: 

- множество А символов, образующих алфавит формальной 
теории; 

- множество Е слов в алфавите А, Е с А* которые 
называются формулами теории; 

- подмножество В формул, В с Е, которые называются 
аксиомами формальной теории; 

- множество отношений В на множестве формул, В с Е", 
которые называются правилами вывода формальной теории. 

Множество символов А может быть конечным или бесконечным 
(счётным). Обычно для образования символов используют конечное 
множество букв, к которым, если нужно, приписываются в качестве 
индексов натуральные числа. 

Множество формул Е обычно задается индуктивным 
определением, например с помощью порождающей формальной 
грамматики. Как правило, это множество бесконечно. Наряду с 
термином «формула» могут использоваться термин «предложение». 
Предложения, отвечающие строгому определению, в отличие от 
произвольных комбинаций символов из А (просто предложений или 
цепочек), иногда называют правильно построенными предложениями. 
В некоторых формальных теориях статус правильно построенного 
предложения может зависеть от контекста или внешних 
обстоятельств. Ниже, если не оговаривается иное, под формулой 
понимается правильно построенная формула рассматриваемой 
формальной теории. 

Множества А и Е в совокупности определяют язык, или 
сигнатуру формальной теории, традиционно обозначаемую как 

У = (А, Р). 

Множество аксиом В может быть конечным или бесконечным 
(но счётным). Если множество аксиом бесконечно, то обычно оно 
задаётся с помощью конечного множества схем аксиом и правил 
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порождения конкретных аксиом из схемы аксиом. Самым 
распространенным правилом порождения конкретных аксиом из 
схемы аксиом является правило подстановки. 

Приведем поясняющий пример. В учебнике [19] сказано 
(цитируем с небольшими сокращениями и в тех обозначениях, 
которые приняты в этой книге): «Каковы бы ни были формулы А, Ви 
С, следующие формулы суть аксиомы: 


(АТ) (4 (В >А)) 
(А2) (А (В Э С)) > (А > В) > (А > С))) 
(АЗ) ((—В ә —А) >> ((—-В > А) > В)) » 


Это следует понимать в следующем смысле. Пусть строчные 
латинские буквы, связки ~ и ->, а также скобки (и ) входят в алфавит 
рассматриваемой формальной теории, а прописные латинские буквы 
не входят. Тогда написанные выражения, помеченные именами (А1), 
(А2) и (АЗ), строго говоря, не являются формулами формальной 
теории, а значит не могут быть и аксиомами. Это именно схемы 
аксиом. Вместо параметров А, В и С можно подставить любые 
формулы, причем вместо всех вхождений какого-либо параметра 
должна быть подставлена одна и та же формула, и полученное 
выражение, которое уже будет являться формулой данной 
формальной теории (заметим в скобках, что это исчисление 
высказываний), объявляется аксиомой. В частности, если в схему АІ 
подставить формулу (р-а) вместо параметра А, и формулу а вместо 
параметра В, (это кратко обозначают следующим образом: 
{(р-а)//А, а!В}), то получится формула ((рР-а)(а-(р-а))), 
которая является правильно построенной формулой и аксиомой 
исчисления высказываний. Если к той же схеме АІ применить 
подстановку {(а—ға)//А, а!В}, то получится формула 
((а—>а)—(а—>(а—а))), которая также является аксиомой исчисления 
высказываний. Множество аксиом исчисления высказываний 
бесконечно, хотя и может быть задано всего тремя схемами аксиом. 

Для прикладных теорий аксиомы зачастую делятся на два вида: 
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- логические аксиомы, прямо заимствованные из базовой 
формальной теории (в нашем случае — из исчисления предикатов 
первого порядка); 

- внелогические аксиомы (также говорят предметные или 
собственные аксиомы), отражающие прикладную специфику и 
содержание конкретной прикладной области. 

Введем еще два понятия, относящиеся к формулам и аксиомам. 

Если существует алгоритм, который по предъявленной 
формуле теории (цепочке знаков алфавита теории) за конечное 
время позволяет сделать вывод о принадлежности (или не 
принадлежности) этой цепочки классу правильно построенных 
формул, то теория называется распознаваемой. 

Если при этом время ограничено полиномом от длины записи 
формулы, то говорят, что теория эффективно распознаваема. 

Если существует алгоритм, который по предъявленной 
формуле за конечное время позволяет сделать вывод о том, что эта 
формула может быть отнесена или не отнесена к множеству 
аксиом, то формальная теория называется аксиоматизируемой. 

Если при этом время ограничено полиномом от длины записи 
формулы, то говорят, что теория эффективно аксиоматизируема. 

Множество правил вывода № чаще всего конечно. 

Сигнатура, аксиомы и правила вывода в общем случае могут 
быть выбраны произвольным образом, с учетом ограничений, 
указанных в определении. Однако конструирование формальных 
теорий только ради самих формальных теорий малопродуктивно”. В 
контексте данной книги нас интересуют такие формальные теории, 
которые описывают какие-то реальные объекты и связи между ними. 
Совокупность реальных объектов и связей между ними часто 
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«Малопродуктивно» —_ исключительно, в контексте прикладных 


исследований. В «чистой» математической логике практика построения 
систем, не имеющих ровным счётом никакого отношения к «реальному 
миру», является обычной и вполне продуктивной. 
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называют предметной областью. Три важных понятия — 
выводимость, логическое следование и интерпретация — образуют 
круг концепций, через которые происходит формальное описание 
неформальных вещей. 

Говорят, что формула С непосредственно выводима из 


формул множества Е), ... , Е», если среди правил вывода существует 
такое правило К, что (Е), ..., Е, С) є К. 
Формулы Ё}, ... , Е, называют посылками, а формулу С — 


заключением правила вывода К. В этой книге непосредственную 
выводимость мы, как правило, будем записывать, разделяя посылки и 
заключение горизонтальной чертой и указывая, если нужно, название 
правила вывода: 


Говорят, что формула С выводима из формул множества 
Е, ...Е в данной формальной теории, если существует 
последовательность формул 

<А), А», ..., А, ..., Ал», 

в которой А,=С°, а каждая формула А; является либо 
аксиомой, либо одной из формул Е}, ..., Е» либо непосредственно 
выводима из некоторых предшествующих формул по одному из 
правил вывода К. 

Тот факт, что формула С выводима из формул РЁ, ..., Р,, 
записывают так: 


ОТ Оа 67 


% Имеется в виду — и это очень важно! — синтаксическое равенство 
(совпадение цепочек символов), в отличие от «привычных» равенств вида 
2+3=5 или у=5іп(х). В логике для этого принято использовать специальный 


символ «==», но мы решили его не использовать, а просто в необходимых 


случаях подчёркивать факт синтаксического совпадения словесно. 
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Формулы А, ..., Ё, называются гипотезами вывода, а сама 


последовательность <А}, А», ..., А, ..., А,> называется (формальным) 
64 
выводом”. 

Если формула С выводима только из аксиом — без 


использования гипотез, то С называется теоремой формальной 


теории. Этот факт обозначается записью НС. 


Выше мы определили ПОНЯТИЯ (эффективной) 
распознаваемости и (эффективной) аксиоматизируемости. Полагаем 
необходимым сделать аналогичное замечание относительно понятия 
теоремы, практически дословно цитируя Э. Мендельсона [19]: 
«Даже в случае эффективно аксиоматизируемой теории понятие 
теоремы не обязательно эффективно, ибо, вообще говоря, может и 
не существовать процедуры (алгоритма), позволяющей узнавать по 
данной формуле, существует ли её вывод в теории. Теория, для 
которой такой алгоритм существует, называется разрешимой, в 
противном случае теория называется неразрешимой. Грубо говоря, 
разрешимая теория — это такая теория, для которой можно 
изобрести машину, испытывающую формулы на свойство быть 
теоремой этой теории, в то время как для выполнения той же 
задачи в неразрешимой теории требуются всё новые и новые 
независимые акты изобретательства». 

Мы видим, что понятия выводимости, вывода и теоремы 
являются чисто синтаксическими, они не апеллируют к 
семантическому понятию истинности. Если в формальной теории 
утверждается, что теорема выводима из аксиом, то это совсем не 
значит, что теорема в каком-то содержательном смысле «истинна» 
или «верна». Это просто значит, что удалось найти формальную 
последовательность формул, которая начинается определенным 
образом (аксиомами), заканчивается определенным образом 


4 у 

6 В математической логике вывод — это вся последовательность 
шагов рассуждения, а не только заключительное утверждение, как в 
обыденной жизни. 
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(теоремой), и все промежуточные формулы связаны определенным 
образом (правилами вывода). Для перехода к семантике нужно ввести 
понятие интерпретации. 

Интерпретация І формальной теории в предметную область 
М — это множество функций, которые отображают конструкции 
формальной теории в множество объектов и утверждений 
относительно объектов предметной области М. 

Множество функций, а не одна функция, нужно потому, что для 
каждого сорта формальных конструкций, используемых в формулах, 
нужна своя функция. Например, при интерпретации формул 
исчисления предикатов (см. следующий параграф) требуется каждой 
формальной константе сопоставить фактический объект, формальным 
функциональным символам — конкретные отображения, 
формальным предикатам — конкретные отношения. После этого 
формула становится содержательным утверждением, и с 
содержательной точки зрения мы можем попытаться проверить, 
истинно утверждение или ложно. 

Истинностное значение формулы А в интерпретации І мы будем 
обозначать 4|; или, если из контекста однозначно понятно, что речь 
идет именно об интерпретации І, просто именем самой формулы с 
чертой интерпретации: А|. Истинностное значение формулы всегда 
определяется одной из констант гие или ѓа[ѕе, чтобы не связывать 
себя записями типа А|;=ігие, мы будем писать А (—Ар, 
подразумевая, что формула имеет значение ќгие (Ѓа[ѕе), или же просто 
А] (—4|) — с учётом сделанного выше замечания об однозначности. 

Формула называется общезначимой (или тавтологией), если 
она истинна в любой интерпретации: УТ (А|). 

Формула называется выполнимой, если существует по крайней 
мере одна интерпретация 1, в которой она истинна: ЭТ (А|р). 

Формула называется невыполнимой (или противоречием), 


если она ложна в любой интерпретации: УТ (—А]|). 
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Пусть есть некоторая формальная теория, некоторая предметная 
область, и задана интерпретация І. Обозначим буквой Т множество 
теорем формальной теории, а буквой Р множество истинных 
утверждений предметной области. Если оказывается, что множества Т 
и Р взаимно-однозначно соответствуют друг другу при 
интерпретации І, то лучшего и пожелать нельзя: все формально 
выводимые утверждения содержательно истинны, а все 
содержательно истинные утверждения формально выводимы. В таком 
случае говорят, что формальная теория адекватна предметной 
области. Адекватность — сильное и редкое свойство. На практике 
чаще приходится довольствоваться более слабыми свойствами. 

Говорят, что предметная область является моделью 
формальной теории, если существует интерпретация 1, при 
которой все выводимые формулы истинны в этой интерпретации: 


ҮС (ЕС (С). 


Говорят, что формальная теория полна для предметной 
области, если существует интерпретация Т, при которой все 


истинные формулы выводимы: ҮС ((С|}) > ЕО). 


Таким образом, адекватная теория имеет модель и полна в своей 
модели. 

Необходимо ясно понимать, что формальные теории не 
являются божественными откровениями или имманентно 
врожденными законами человеческого разума — формальные теории 
придумываются людьми для формализации конкретных предметных 
областей, и эти придумки оказываются более или менее удачными, в 
зависимости от изобретательности придумывающего. Для одной и 
той же предметной области можно придумать разные формализации, 
и часто так и происходит: разные формализации конкурируют друг с 
другом и меняют друг друга”. 


Е Самым известным примером, является, видимо, геометрия. 


«Начала» Евклида — исторически, наверное, самая первая формальная 
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Семантическое понятие интерпретации ведет к понятию 
логического следования. 

Логическое следование. Говорят, что формула С логически 
следует из формул Е), ..., Е, (обозначение Е), ..., Е, > О), если 
формула С истинна во всякой интерпретации, в которой истинны 
формулы Е}, ..., Е: 

Е... «Е, — С). 

Логическое следование — это  семантическое понятие. 
Выводимость — это синтаксическое понятие. Они могут быть 
связаны, и они связаны однозначно, если теория адекватна, а могут и 
не быть связаны так прямо. Все зависит от правил вывода К. 

Говорят, что правила вывода К состоятельны, если из 
формальной выводимости получается логическое следование: 


И 5 Ев С - ПОРЕ а С. 
66 
Говорят, что правила вывода К полны”, если любое логическое 
следование подтверждено формальной выводимостью: Е}, ..., Е, > С 
ЕЯ Ва -ь С. 


теория, которая служила образцом два тысячелетия, хотя и не была 
построена достаточно строго и формально с современной точки зрения. 
Многие математики пытались улучшить построения Евклида. 
Лобачевского, например, такие попытки привели к открытию 
неевклидовых геометрий. Чуть более ста лет тому назад Давид Гильберт 
написал книгу «Основания геометрии», и эта работа стала новым эталоном 
качества формальной теории. Уже в конце ХХ века отечественный 
математик А.В. Погорелов предложил свою аксиоматику геометрии, 
весьма удачную и современную, так что даже рассматривался вопрос о 
введении этого варианта формальной теории в качестве основного в курс 
средней школы. Все эти формальные теории различны, но предметная 
область — множество содержательно истинных утверждений о свойствах 
геометрических объектов — одна! 


6 Чаще понятие состоятельности не используется, а полнота 
трактуется как эквивалентность доказуемости и следования: К, ..., Р, > С 
= ЁР!,....ЁЕ, К, С. Мы сочли целесообразным отдельно называть и 


рассматривать те две импликации, которые образуют эту эквивалентность. 
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4.1.2. Язык исчисления предикатов первого порядка 


Основным инструментом представления знаний, 
рассматриваемым в этой главе, являются формулы прикладного 
исчисления предикатов первого порядка. Еще Давид Гильберт указал, 
что «исчисления предикатов первого порядка достаточно во всех 
разумных случаях». Мы рассматриваем здесь исчисление предикатов 
как язык, как систему обозначений для записи логических 
утверждений. Более того, мы считаем, что этот язык знаком читателю 
на уровне таких понятий, как логические связки («И», «ИЛИ», «ЕСЛИ 
... ТО») и кванторы («для всякого», «существует»)“”. 

Мы рассматриваем язык, в котором участвуют логические 
связки, кванторы и атомарные формулы, построенные над 
множеством функциональных символов, предметных переменных и 
констант. Ниже приведена формальная грамматика языка исчисления 
предикатов первого порядка. При этом считаются заданными 
следующие множества отличимых друг от друга символов: 
множество символов констант (обозначение Конст), множество 
символов переменных (обозначение Перем), множество символов 
функций (обозначение Функ) и множество символов предикатов 


(обозначение Предикат). 


Терм: Конст | Перем | Функ (Список термов) 
Список термов: Терм | Терм, Список термов 
Атом: Предикат | Предикат (Список термов) 
Литерал: Атом | — Атом 

Формула: Атом | — ( Формула ) | 


(Формула Связка Формула) | 
Квантор Перем ( Формула ) 
Связка: А |= 


Квантор: м |= 


А 
°7 В предыдущем параграфе мы уже использовали некоторые 


обозначения исчисления предикатов (кванторы У, 3 и связку ->) без 
определений, именно в расчете на то, что читатель с ними знаком. 
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Понятие литерала (атом или отрицание атома), вообще говоря, 
грамматически излишне. Мы ввели его, чтобы иметь под рукой этот 
термин. Предикат без аргументов также излишен. Мы ввели его для 
того, чтобы исчисление высказываний синтаксически было частным 
случаем исчисления предикатов. 

Необходимо сделать несколько замечаний, касающихся 
грамматики этого языка. 

1. Во-первых, в этом языке мы считаем, что наши 
функциональные и предикатные символы имеют фиксированные 
имена и фиксированное число аргументов, как в обычных системах 
программирования. Это довольно сильное допущение, и можно, в 
принципе, так не считать. В таком случае нам пришлось бы иметь 
дело с А-выражениями и смешанными вычислениями, что выходит за 
рамки данного курса. 

2. Во-вторых, язык, который мы используем, в логической 
иерархии классифицируется, как язык первого порядка. Другими 
словами, это означает, что под кванторами могут стоять только 
предметные переменные, т.е. не функциональные символы и не 
предикаты. В противном случае, то есть если допускается, что 
квантор может связывать не только предметные переменные, то это 
будет уже исчисление не первого порядка. В реальных современных 
системах ИИ используются именно такие исчисления. Например, 
модное направление Мо4е! Сһескіпо основано на темпоральных 
логиках, которые выглядят как логики первого порядка, а на самом 
деле сводятся к стандартным логикам не первого порядка. 

3. В-третьих, приведенная грамматика языка исчисления 
предикатов предполагает формальную запись утверждений в 
определенном синтаксисе, со всеми необходимыми скобками и т.д. В 
нашем рассмотрении примеров мы, естественно, сильно упростим 
формальный синтаксис, и будем записывать формулы как удобнее, 
однако так, чтобы всегда можно было догадаться, какие 
синтаксические упрощения используются в том или ином случае. В 
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частности, используется обычный приоритет связок и кванторов, 
лишние скобки систематически опускаются. 

4. В-четвертых, известно, что чистое исчисление предикатов 
первого порядка имеет ограниченную выразительную силу. Другими 
словами, многие содержательные теории невыразимы или трудно 
выразимы в чистом исчислении первого порядка, необходимы 
внелогические допущения. Естественно, что мы допускаем 
константы, функциональные символы и предикаты, которые нужны 
для описания предметной области. Но помимо этого, считается, что 
натуральные числа и другие общеизвестные понятия можно 
использовать в любых формулах, не пытаясь аксиоматически описать, 
что на самом деле это такое. 

5. В-пятых, замкнутых формул вполне достаточно, и можно не 
рассматривать незамкнутые формулы, потому что если есть 
незамкнутая формула, то она будет выполнима тогда и только тогда, 
когда выполнимо соответствующее замыкание. Поэтому формулы 
записываются в открытой форме, при этом считается, что все 
свободные переменные замыкаются квантором всеобщности. 


4.1.3. Предложения 


В 1965 году для доказательства общезначимости логических 
формул Джон Алан Робинсон предложил метод резолюций. Идея 
этого метода основана на работах Эрбрана, но поскольку тот не думал 
о применении своего метода на компьютерах (что было не 
удивительно в 1930 г.), метод Эрбрана оказался не очень подходящим 
с вычислительной точки зрения. Робинсон сделал его пригодным для 
реального применения и разработал алгоритм унификации, 
являющийся основой метода. 

Метод резолюций применим в логических исчислениях, в 
которых используются формулы особого вида, называемые 
предложениями. 

Предложение (с1аизе)— это бескванторная дизъюнкция 
литералов. 
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Любую формулу исчисления предикатов первого порядка 
можно свести к предложениям с помощью последовательного 
применения следующих действий: 

1. Элиминация импликации. Импликация заменяется 
дизъюнкцией с отрицанием первого операнда. А-В = —АУВ. 

2. Протаскивание отрицания. Отрицания оставляются только 
перед атомами. Осуществляется по правилам де Моргана с 
использованием свойства кванторов и инволютивность отрицания. 
—(А& В) = (—Ау—В), —(А\МВ) = (м &—В), —\Улх(А) = 3х(—А), 
—9х(А) = Ух(—А), — ЈА = А. 

3. Разделение связанных переменных. Связанные переменные 
переименовываются таким образом, чтобы они случайно не 
совпадали В разных кванторах. т р 9 
= \Ух(...Эу(...У...)...), и аналогично для любых других комбинаций 
кванторов. 

4. Приведение к предваренной форме. Преобразование 
формулы к такому виду, когда она начинается с кванторного 
префикса, за которым следует бескванторная матрица. 
А\\Ух(В) = Ух(АУВ), и аналогично для любых других комбинаций 
кванторов и связок. 

5. Сколемизация. Элиминация кванторов существования с 
помощью ввода новых функциональных символов и констант. 
Эх(А(...х...)) = А(...а...), Ух(ЗУСАС...у...)))= УХ(А(...Й)...)), где а— 
новая константа, а ѓ — новый функциональный символ. 

6. Элиминация кванторов всеобщности. Поскольку 
рассматриваются только замкнутые формулы, оставшиеся кванторы 
всеобщности опускаются, так как они подразумеваются. 
УХ(А(...х...)) = А(...х...). 

7. Приведение к конъюнктивной нормальной форме. 
Главной операцией в конъюнктивной нормальной форме является 
КОНЪЮНКЦИЯ, она соединяет группы ДИЗЪЮНКЦИЙ. 
А\(В&С) = (АУВ)&(ВУС). 
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8. Разбиение на предложения. Формула разбивается на 
множество предложений. А&В = А, В. 

Это не единственно возможный способ сведения формул 
исчисления предикатов к предложениям, существует и другие 
эквивалентные способы. Сведение к предложениям не является 
логически эквивалентным, но справедливо следующее утверждение, 
которое мы приводим без доказательства. 

Теорема. Те формулы, которые получились в результате 
сведения исходных формул к предложениям, образуют 
противоречивое множество тогда и только тогда, когда исходное 
множество формул не выполняется. 

Рассмотрим примеры сведения формул исчисления предикатов 
первого порядка К предложениям с использованием 
последовательности действий, указанного выше. 

Сведем к предложениям формулу: Ух (Р(х)>3у О(х, у)). 

1) Ух (-Р@) м Зу О(х, у)) 

2) формула без изменений 

3) формула без изменений 

4) Ух Зу (Р(х) у О(х, у)) 

5) Ух (Р(х) м Ох, Кх))) 

6) Р(х) у О(х, х)) 

7) формула без изменений 

8) формула без изменений 

Сведем теперь к предложениям отрицание предыдущей 
формулы: —\Ух (Р(х) эу О(х, у)). 

р Ух (ЪР(х) м Зу ОС, у)) 

2) Эх (Р(х) & Уу (О(х, у))) 

3) формула без изменений 

4) 3х Уу (Р(х) & Ох, у)) 

5) Му (Р(а) & —О(а, у)) 

6) Р(а) & —Оца, у) 

7) формула без изменений 
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8) Р(а), Оба, у) 
4.1.4. Правило резолюции 


В методе резолюций используется не только особый вид 
формул, но и особое правило вывода. 

Правило резолюции — правило вывода новой формулы 
(предложения) из двух предложений. Резольвента — новое 
предложение, полученное в результате применения правила 
резолюции. 

Правило резолюции применимо только к предложениям, 
содержащим контрарные унифицируемые литералы (Р и -Р) и 
состоит в следующем. Если даны два предложения (содержащие 
контрарные унифицируемые литералы), из этой пары предложений 
можно вывести новое предложение, объединяя исходные 
предложения и выбрасывая (элиминируя) контрарные литералы: 

РУО у... О, Рх“ К Уу...у В, 
О м...уО, Б, у... В, 

Напомним, что мы очень любим записывать правила вывода 
«многоэтажно» т.е. следующим образом: над чертой размещаются 
посылки (антецедент) правила, под чертой заключение (сукцедент). 

Резольвента есть объединение (точнее, дизъюнктивное 
соединение) всех литералов за исключением пары контрарных. При 
этом как индекс и, так и индекс т могут иметь любое значение. В 
частности, если резольвируются предложения, которые содержат 
только контрарные литералы, то резольвента — пустое предложение. 
Заметим, что по определению пустое предложение считается 
тождественно ложным. 

Правило резолюции — очень мощное правило! Многие правила 


(например, Мойиѕ ропепз“) являются частными проявлениями 


68 
Латинское словосочетание то4и$ ропеп4о ропепѕ, обычно 


сокращаемое до то4и$ ропепѕ, сейчас на русский язык переводят как 
«правило отделения». По средневековой традиции логические термины 
используются на языке оригинала, без перевода. 
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правила резолюции. Ниже в таблице 4.1 приведены некоторые 
известные правила в традиционной форме и записанные в 
отраничениях метода резолюции, когда посылки и заключения 
являются бескванторными дизъюнкциями литералов. Из этих 
примеров видно, что правило резолюции не слабее традиционных, и 


все, что можно вывести традиционным способом с помощью тойиѕ 


ропепѕ, можно вывести и с помощью правила резолюции! 


Таблица Ошибка! Текст указанного стиля в документе 
отсутствует..2. Традиционная и резолютивная форма правил вывода 
Название правила Традиционная форма | Резолютивная форма 
Моди$ ропепѕ А, А>В А, АУ В 

В В 
Транзитивность АЭ В, ВЭС АУ В, —ВУС 
А С АМ С 
Слияние Ау В, А-В Ау В, —АУВ 
В В 

Правило резолюции само по себе в одиночку образует полную и 

состоятельную систему правил (см. параграф 0). Докажем это 


утверждение для случая исчисления высказываний, дав подходящие 
упрощенные определения. 

Правило вывода состоятельно, если заключение является 
логическим следствием посылок. 

Теорема. /равило резолюции состоятельно. 

Доказательство. Пусть 1 — произвольная интерпретация, С; и 
С, — это предложения, которые резольвируются по правилу 
резолюции, Р — тот литерал, по которому ведется резольвирование. 
Пусть, для определенности, предикат Р входит в предложение С! 
положительно, а в С, с отрицанием. Пусть Су И Се это то, что 
получается после выбрасывания из предложений контрарных 
литералов. 

По условию теоремы КҚС) & КС). Тогда если ПКР), то 
Си + © & КС), а значит ІКС, С). Если же 1(-Р), то С + 2 & 1С), 


а значит все равно (С, У С). Ч. т.д. 
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Правило вывода полно, если любая общезначимая формула 
может быть выведена по этому правилу. 

Теорема. //равило резолюции полно. 

Доказательство. Как известно, правило то4а$ ропепѕ для 
исчисления высказываний полно и является частным случаем 
резолюции, как видно из таблицы 4.1. Ч.т.д. 


4.1.5. Унификация 


Для того чтобы применить метод резолюций, нам нужно найти 
контрарные литералы. В случае исчисления высказываний, такой 
проблемы нет. Любая переменная и та же переменная с 
отрицанием — это и есть пара контрарных литералов. В случае 
исчисления предикатов первого порядка это не так просто. Даже 
когда мы нашли два вхождения одного предиката, положительное и с 
отрицанием, это еще не значит, что найдена контрарная пара. После 
предикатной буквы могут стоять разные аргументы, и они могут 
отличаться в том и в другом случае. В некоторых случаях путем 
подстановки можно литералы унифицировать, то есть сделать такие 
замены переменных, что атомы литералов сделаются одинаковыми, 
но в других случаях этого сделать нельзя. Существуют алгоритмы (в 
частности, алгоритм 4.1, который проверяет, можно ли 
унифицировать две формулы (в частности, два атома) и находят набор 
унифицирующих подстановок, если унификация возможна. Уточним 
определения. 

Частный случай формулы — результат подстановки в 
заданную формулу некоторой формулы вместо всех вхождений 
определенной переменной в исходную формулу. 

Унификация — процедура вычисления общего частного случая 
для двух формул, (если он существует). 

Унификатор — это такой набор подстановок определенных 
формул вместо переменных, при применении которого к заданным 
формулам получается их общий частный случай. 
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Наиболее общий унификатор (Геаѕі Соттоп Ипйфег) — это 
минимальный набор подстановок, который унифицирует формулы. 

Сделаем несколько общих замечаний к определениям. 

1. Во многих формальных теориях частный случай формулы 
является ее логическим следствием. В частности, это справедливо 
для формул исчисления высказываний и для предложений 
(бескванторных дизъюнкций литералов). 

2. В подавляющем большинстве случаев формулы не имеют 
общего частного случая. Поэтому при унификации важно как можно 
быстрее получать отрицательный ответ. 

3. Вообще говоря, вместо переменной можно подставлять терм, 
содержащий эту же переменную. Однако такая подстановка 
никогда не может привести к унификации, поэтому в 
унификаторах подобные подстановки запрещены. 

4. Если с — наиболееѕ общий унификатор (стандартное 
сокращение Н.О.У.), а Ө — любой унификатор, то существует такая 
подстановка р, что Ө = с°р, где? — знак композиции подстановок. 

Например, две формулы Р(х, Ка)) и Р(2(р), у)) унифицируемы, 

Н.О.У. [Р(х, Ха)), Р(в(Ь), у))] = { 8(Б)Их, Ха)! }. 

В то же время формулы Р(х, Ка)) и Р(у, 2(6)) не унифицируемы, 
потому что Ка\е(Ф) при любых подстановках формул вместо 
переменных. Также не унифицируемы формулы Р(х, Ка)) и Р(2(р), х)), 
поскольку для унификации требуется подставить вместо переменной 
х формулу Ка) и формулу 2(р), что, очевидно, невозможно. 

Мы приводим классический алгоритм унификации (алгоритм 
4.1), предложенный Робинсоном, в несколько упрощенной 
формулировке. Сразу заметим, что этот алгоритм — далеко не самый 
эффективный их известных в настоящее время. На вход алгоритма 
подаются два выражения А и В, записанные в префиксной 
(функциональной) форме, на выходе получается значение Ёа1зѕе, 


если выражения не унифицируемы, или значение +гиае и Н.О.У с. 
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Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..14. Унификация двух формул. 


ргос Оп1Еу (іп А, В; ооё с) : Боо1 

с := © 

мһі1е АВ ао 
[А’,В’] := ЕіѕгЕМедТегтиѕ (А, В) 
1Е — Іѕбирѕї (А',В’,ї,у) ЕҺеп гебакп (ЁЕа15$е) 
епа 1Е 
с := 0° {//у} 
А := ЗарзЕ (А, Е, У) 
В := бирѕі (В, Ё, у) 


епа мһі1е 

гебагп (Егае) 
епа ргос 

В этом алгоритме используются следующие функции и 
операции. 

1. Функция ЕіѕгіМеаТегтиз сравнивает свои аргументы слева 
направо и находит первые подформулы, в которых сравниваемые 
формулы отличаются. Например, сравнивая формулы Р(х, Ка)) и 
Р(е(р), у)) функция Е1зхЕМеаТегиз вернет пару [х, 2(р)]. 

2. Функция Іѕ50орзі (А’,В’,Е,у) проверяет, образует ли 
первая пара аргументов А’ и В’ допустимую подстановку, то есть 
является ли один из этих аргументов некоторой переменной у, а 
второй — формулой Ё, не содержащей вхождений этой переменной у. 
Например, если первый и второй аргументы функции равны х и 2(№Р) 
соответственно, то функция вернет значение гие, причем третий 
аргумент Е получит значение 2(Ъ), а четвертый аргумент у получит 
значение х. 

3. Функция 505+ (А, +, Уу) подставляет в формулу А 
формулу Е вместо всех вхождений переменной у. Например, если 
аргументы функции Р(х, Ќа)), (р), х соответственно, то результатом 
функции является формула Р(2(Р), Ка)). 
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4. Операция ° является композицией подстановок. Выполнение 
ее состоит в том, что все подстановки правого аргумента 
применяются ко всем подставляемым формулам левого аргумента, 
после чего множества подстановок объединяются, а совпадающие и 
тривиальные подстановки удаляются. 

Рассмотрим пример — протокол работы алгоритма 4.1 для пары 
формул Р(а, х, Ќ2(у))) и Р(2, КЗ, Ќи)). В этом примере в каждой 
строке выписаны текущие значения переменных А и В, причем 
найденные функцией Еі гѕЕМедТегтѕ несовпадающие подформулы 
подчеркнуты. Справа выписан построенный унификатор. 


Р(а, х, Ј(8())) Р(2, Хз), Жи)) с = {а//5 } 
Р(а, х, Ј(8())) Ра, Ка), Ки)) с = {а//<, Да)//х} 
Р(а, Ка), Ҳ80))) Р(а, Ќа), и)) с = {а//з, Да)/х, 8(у)//и} 


Р(а, Ка), %8())) Р(а, Ха), {&0))) 


Мы видим, что всего за четыре шага алгоритм заканчивает 
работу и находит наиболее общий унификатор. Однако не следует 
обольщаться и считать, что задача унификации — это простая задача. 
На самом деле, все «элементарные» операции, использованные в этом 
алгоритме — нахождение несовпадающих подформул, проверка 
допустимости подстановки, выполнение подстановки и даже 
вычисление композиции подстановок — в реализации отнюдь не 
элементарны, и их фактическая трудоемкость кардинально зависит от 
выбранного способа представления формул. Между тем, 
представление формул для алгоритма 4.1 не определено. 

Рассмотрим еще один алгоритм унификации, в котором 
структура формул фиксирована более явно. Применительно к 
рассматриваемому методу резолюций, нам нужно проверять 
унифицируемость атомарных формул, синтаксис которых описан в 
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параграфе 0. Чтобы не затуманивать идею алгоритма, мы оставим в 
языке только функциональные символы и переменные”. 

В алгоритме 4.2 предполагается, что функция ор осуществляет 
синтаксический разбор формулы и возвращает знак главной операции 
(имя предиката, функциональный символ или имя переменной), 
функция уаг проверяет, является ли ее аргумент именем переменной, 
а функция агоѕ возвращает список аргументов главной операции. 
Набор подстановок (унификатор) представлен в виде глобального 
массива 5, значениями индекса которого являются имена 
переменных, а значениями элементов — формулы, которые 
подставляются вместо соответствующих переменных. 

Алгоритм 4.2 основан на следующей идее. При любых 
подстановках формул вместо переменных главная операция (предикат 
или функциональный символ) формулы остается неизменной. 
Поэтому, если главные операции формул различны, то формулы 
заведомо не унифицируемы. В противном случае, то есть, если 
главные операции совпадают, формулы унифицируемы тогда и 
только тогда, когда унифицируемы все подформулы, являющиеся 
аргументами главной операции. Эта рекурсия заканчивается, когда 
сопоставление доходит до переменных. Переменная унифицируется с 
любой формулой, не содержащей этой переменной (в частности, с 
другой переменной) простой подстановкой этой формулы вместо 
переменной. Но подстановки для всех вхождений одной переменной 
должны совпадать. 

Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..15. Рекурсивная унификация двух формул. 
ргос Оп1Еу (іп А, В) : Боо1 

а := Е(А); Юр := Е(В) 


я Предикатные символы с точки зрения унификации ничем не 
отличаются от функциональных символов, а константы, хотя и требуют в 
коде алгоритма большого числа отдельных проверок, по существу 
подчиняются одному простому правилу: константа унифицируется только 
с переменной. 
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// обе формулы суть переменные 
1Е уаг (а) & уаг (р) ЕБеп 
1Е а = р +Һеп геіийигп гие епа 1Е 


1Е 5[а]=@ & 5[60]+0 ЕҺеп 5 [а] := $ [Ы] 
геёџгп гие епа 1Е 
1Е 5[6]=@ & 5[а]+© ЕҺеп 5 [6] := [а] 


геіиџгп Егае епа 1Е 
1Е 5[а]= @ & 5[0]#@ ЕҺеп Опіғу(5 [а], $[Ъ]) 
епа 1Е 
ѕ [а] := Ы // или $510] := а 
епа 1Е 
// одна формула — переменная, а другая — нет 
1Е уаг(а)\у уаг (р) ЕЪБеп 
1Е уаг(а) & аеВ ЕВеп гебакп Ға1ѕе е1зе 
1Е 5[а] = Ӧ +Ъеп 5[а] := В; 
гебагп гие 
е1зе геіџгп (5[а] = В) 
епа 1Е 
епа 1Е 


1Е уаг (р) & БЕА +Һеп гееагпр Ға1ѕе е1ѕе 


1Е 5[0] = © %4Беп $[Ъ] := А; 
гееагп Егае 
е1зе гебагп (5[Ъ] = А) 
епа 1Е 
епа 1Е 


епа 1Е 


// обе формулы не переменные 


1Е аб +Һеп гебагп Еа1зе епа 1Е 
// главные операции различны 
Бог аєагдѕ (А) || Юеага$ (В) ао 
1Е —Оп1 Ру (а, р) ЕБеп хгебакп Еа1зе епа 1Е 
епа Ғог 
геёигп гие 
епа ргос 
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В данном алгоритме заголовок цикла Еог аєагдѕ (А) || 
рєагдѕ (В) ао означает параллельный цикл по спискам 


аргументов. 
4.1.6. Опровержение методом резолюций 


Процедура доказательства по методу резолюций на самом деле 
является процедурой опровержения, то есть вместо доказательства 
общезначимости формулы доказывается, что ее отрицание 
противоречиво, в значительной степени, такой подход выбран, исходя 
из соображений «технического удобства». Это типичная схема 
доказательства от противного. Докажем теорему, обосновывающую 


правильность этой схемы для случая исчисления высказываний. 


Теорема. Если А,-С Е Е, где Е противоречие, то АЕ О. 
Доказательство. По теореме дедукции” если А—СЕР, то 


НА &—С УЕ, и значит А &—С Е — тавтология. Но А &—С > Е = 
—(А &—() уУЕ =—АуС=А-0(. Значит А-— С — тавтология и 


ҺА ә С, откуда, еще раз применяя теорему дедукции, имеем АЕ С. 


Ч.т.д. 

Поскольку мы рассматриваем дизъюнктивные формы, то пустые 
дизъюнкции следует рассматривать как тождественно ложные. 
Значит, в качестве невыполнимой формулы Ё, которая упомянута в 
предыдущей теореме, удобно использовать пустую дизъюнкцию, не 
содержащую никаких дизъюнктивных слагаемых. Именно так 
традиционно делается в методе резолюций, а пустая дизъюнкция 
традиционно обозначается знаком (0. 


Следствие. Если А—С | О, где Ш — пустая формула, то АН С. 


Таким образом, можно сформулировать определение метода 
резолюций. 


7 Теорема дедукции утверждает, что А + В > А-> В. 
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Метод резолюций — это метод автоматического 
доказательства теорем, основанный на опровержении множества 
посылок А и отрицания целевой теоремы С с использованием правила 
резолюции. 

Рассмотрим порядок применения метода резолюций: 


Пусть необходимо установить выводимость А | С. 


1. Каждая формула множества формул А и формула —С 
независимо преобразуются в множества предложений. 

2.В полученном множестве предложений отыскиваются 
резольвируемые предложения. 

3.К ним применяется правило резолюций, и резольвента 
добавляется в множество до тех пор, пока не будет получено пустое 
предложение. 

При этом возможны следующие исходы: 

1.В результате применения метода резолюций получается 
пустая формула. Это означает, что теорема доказана. Мы построили 
вывод формулы С из формул А. 

2. В результате применения метода резолюций не получается 
пустая формула, и среди текущего множества предложений нет 
резольвируемых. Это означает, что мы опровергли теорему, то есть 
что формула С невыводима из множества формул А. 

3. Процесс не заканчивается. Правило резолюции применяется, 
множество предложений пополняется, среди них нет пустых, и есть 
резольвируемые. Это ничего не означает. 

Другими словами, метод резолюций является частично 
корректной процедурой. Третий исход нельзя назвать зацикливанием, 
поскольку нет никакого способа определить, почему метод 
резолюции продуцирует новые резольвенты, но при этом не 
получается пустого предложения. Означает ли это, что теорема верна, 
но мы просто не дождались завершения? Не известно. Означает ли 
это, что в результате так никогда и не получится пустой формулы? И 
этого мы тоже не знаем. Это логически неразрешимая задача. В 
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принципе нельзя узнать, как долго нужно ждать для того, чтобы 


получить ответ на этот вопрос. 
4.1.7. Программная реализация метода резолюций 


Все сказанное выше можно записать в виде алгоритма 4.3. 
Алгоритм Ошибка! Текст указанного стиля в документе 
отсутствует..16. Метод резолюций. 
ргос В(5) 
9 
мһі1Іе О # С ао 
Бетес Есу р Ва 1. 25) 
1Е р1,р2 = п11 ЕВБеп гебагп Еа11 епа 1Е 
р := Вез{рт, ра, 11, 14а, 5) 
Ее 
епа мһі1е 
гееагп ОК 
епа ргос 


ртос вез (РЕ; р, 11, 12,5) 
ры += РЕ; РА з= р213]} 
рр Пе В: = ра 1 
гебагп р1 У р2 

епа ргос 


ргос бе1есе(С, рі, ро, 11, 12, 3) 


Выбрать в множестве предложений С два предложения рі, 
р2, содержащие контрарные литералы 11, 12, 
унифицируемые наиболее общим унификатором $ 


епа ргос 

При записи этих процедур используется наша стандартная 
практика составления алгоритмов для решения переборных задач — 
то, что можно фиксировать, фиксировано. В частности, процедура 
Вез фиксирована. Нефиксированной процедурой является процедура 
бе1есе. Стратегия управления перемещена в эту функцию, которая 


выбирает два предложения для резольвирования. 
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Пример. 

Всякий программист знает метод резолюций. 

Студенты не знают метода резолюций. 

Некоторые студенты умные люди. 

Следовательно, некоторые умные люди не являются 
программистами. 

Логически последнее утверждение верно. Проверим его 
механическим путем с помощью метода резолюций. 

Введем множество предикатов, описывающих высказывания, 
используемые в вышеприведенных утверждениях: 

П — «быть программистом», 

Р — «знать метод резолюций», 

С — «быть студентом», 

У — «быть умным человеком». 

На языке формул исчисления предикатов первого порядка 
исходные утверждения (посылки) будут выглядеть следующим 
образом: 

Ух П(х) = Р(х), 

Ух С(х) >> Р(х), 

Эх С(х)У(х). 

Целевая формула: Эх У(х) П(х). 

Отрицание целевой формулы: Ух —У(х) мП(х). 

Опровергнем ее с помощью метода резолюций. 

1. Сводим к предложениям исходные формулы: 

Ух По) > Р(х) преобразуется в — П(х) м Р(х), 

Ух С(х) —> —Р(х) преобразуется в —С@о)\у-—Р(х), 

Эх С()У(х) преобразуется в С(а) и У(а), 

Ух —У(х) УПО) преобразуется в —У<) УПО. 

Таким образом, мы получили следующее множество 
предложений 5: 

9 = {— П(х) у Р(х), С(х)м~Рр(х), С(а), У(а), ЈУ(х) мП(х) } 
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2. Применяем правило резолюции к 4-му и 5-му предложениям и 
добавляем их ко множеству предложений: 

9 = {— П(х) м Р(х), —С(х)у—Р(х), С(а), У(а), —У() УПО, П(а) } 

3. Применяем правило резолюции к 1-му и 6-му предложениям и 
добавляем их к множеству предложений: 

9 = {~ П(х) у Р(х), —С<)у-Р(х), С(а), У(а), у(х) По, 
Па), Р(а)) 

4. Применяем правило резолюции к 7-му и 2-му предложениям и 
добавляем их к множеству предложений: 

9 = {~ П(х) у Р(х), ~С(х)м-рР(х), С(а), У(а), у(х) По, 
Па), Р(а), — С(а)) 

5. Применяем правило резолюции к 8-му и 3-му предложениям и 
добавляем их к множеству предложений: 

9 = {— По) м Р(х), =С(х)м~Р(х), С(а), У(а), Ус) мП(х), П(а), 
Р(а), – С(а), 0) 

Мы получили пустое предложение, следовательно, получено 
опровержение отрицания целевой формулы, т.е. целевая формула 
доказана. 

Обычно вывод по методу резолюций записывают в сокращенной 
форме: предложения нумеруют, множество выписывают в виде 
последовательности добавляемых резольвент, а для каждой 
резульвенты указывают номера резольвируемых предложений. 
Например, в сокращенной форме построенный вывод выглядит 
следующим образом: 

1. — П(х) у Р(х) 

. =С(х)м~р(х) 

. С(а) 

. У(а) 

. —У(х) УПО) 

. Па) (4, 5) 
. Р(а) (1, 6) 
. —С(а) (2, 7) 


о чо алоо м 
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9.0 (3, 8) 
В последующих примерах выводы методом резолюций 
записываются в сокращенной форме. 


4.2. СТРАТЕГИИ ПОИСКА ОПРОВЕРЖЕНИЯ МЕТОДОМ 
РЕЗОЛЮЦИЙ 


Один из самых важных вопросов, касающихся метода 
резолюций — откуда взять функцию Ѕе1есі, которая выбирает пару 
резольвирумых предложений? Это ключевой вопрос. Удачно 
выбранная функция может быстро привести к цели. Неудачная 
будет порождать все новые и новые непустые резольвенты, не давая 
решения. 

Способ выбора предложений для резольвирования называется 
стратегией метода резолюций. 


4.2.1. Полные стратегии 


Ключевое понятие, относящееся к стратегиям — это идея 
полноты. К понятию «полноты» — в разных её ипостасях — мы 
возвращаемся постоянно и делаем это совершенно осознанно. Мы 
абсолютно уверены в том, что использование того или иного 
инструмента (в любой области человеческой деятельности и в 
программировании — в том числе) всегда должно сопровождаться 
чётким пониманием всех возможностей и ограничений, свойственных 
этому инструменту. Мы очень рассчитываем на то, что после 
внимательного ознакомления с этой книгой читатель сможет 
использовать замечательные результаты, полученные в области 
обработки знаний, не как «волшебную палочку», но с пониманием 
всех тонкостей функционирования инструмента и возможностью, в 
случае необходимости, внесения новых еще более замечательных 
усовершенствований. 

Полная стратегия— это такая стратегия поиска 
опровержения, про которую известно, что если существует какое- 
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либо опровержение по методу резолюции, то существует и 
опровержение по данной стратегии. 

Рассмотрим две известнейшие полные стратегии. 

1. Стратегия поиска в ширину (полный перебор). 

В этом случае на каждом шаге строятся все возможные 
резольвенты (стратегия очевидно полна, так как любой вывод будет 
содержаться в полном переборе). 

Рассмотрим полный перебор на примере задачи о 
программистах и студентах, которые знают или не знают метод 
резолюций (см. параграф 0). 

—По)уР(х) —Со)у-РО С(а) У(а) –У(х)мП(х) 


—П(х) Р(х) м-У(х) -Р(а) Ца) 

и—С() 

1а) -С(х) Р(а) —С(а) -У(а) 
м—У(х) уа) 

—С(а) О 


Первая строчка — это исходные пять предложений. Напомним, 
это предложения, которые получились путем преобразования в форму 
предложений условий задачи и отрицания целевой теоремы. 

Во второй строчке написан полный перебор всех предложений, 
которые получаются путем резольвирования первой строчки 
(исходных предложений). В третьей строчке написаны все новые 
предложения, которые получаются путем резольвирования тех 
предложений, которые написаны в первых двух строчках. В 
четвертой строчке появится пустой квадратик при резольвировании 
У(а) из первой строки и —У(а) из третьей строки. 

В результате после третьего пополнения исходного множества 
предложений будет построено пустое предложение и закончен вывод, 
но перед этим будет построено довольно много предложений, 
которые в выводе не участвуют, они, безусловно, лишние. Это и есть 
стратегия полного перебора. Она не эффективна, как и большинство 
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полных стратегий, однако всегда заканчивается положительным для 
нас результатом — мы получаем ответ, если он существует. 

2. Линейная стратегия. 

В случае линейной стратегии на каждом шаге, кроме первого, 
одно из резольвируемых предложений — это последнее полученное 
предложение, последняя резольвента. Самое первое предложение 
называется верхним. Предложение, полученное из предыдущего шага 
(на первом шаге это верхнее предложение, на последующих шагах — 
это последняя полученная резольвента), называется центральным. 
Второе резольвируемое предложение называется боковым. Таким 
образом, боковое предложение — это либо исходное предложение, 
либо одно из центральных, полученных ранее. 

Линейная резолюция выглядит для ТОЙ же задачи более 
эффективной, чем полный перебор. Выберем в качестве верхнего 
предложения первое предложение из исходного множества 
предложений 

—ИС)\УР(х) —С(х)у-Р(х) С(а) У(а) УХ). 

В качестве бокового предложения каждый раз будем выбирать 
первое подходящее, записывая вывод в виде последовательности пар 
предложений: слева центральное, справа — боковое. 

—П(х)мР(х)  —С<®у-Р® 
—Пб)у—С(х) С(а) 


—П(а) —П(х)мР(х) Ща) —-У@® ог П®) 
Р(а) —С(х)м=Р(х) У(а) 

—У(а) 
—С(а) С(а) О 


Здесь выписаны все предложения, которые получаются по ходу 
решения. Их несколько меньше (11), чем в случае полного перебора 
(16). Но в этом случае пустое предложение появится только на 
шестом уровне пополнения. Однако это ничего не значит. В другом 
случае полный перебор может оказаться эффективнее. 
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Естественно, есть и другие примеры полных стратегий, которые 
широко представлены в литературе [6]. 


4.2.2. Неполные стратегии 


Неполная стратегия — это стратегия, не обладающая 
свойством полноты. 

Если алгоритм метода резолюций с неполной стратегией не 
заканчивает свою работу, то это означает не то, что доказательства не 
существует, а то, что с помощью выбранной стратегии его найти не 
удается. 

Тем не менее, такие стратегии достаточно часто применяются, 
потому что неполные стратегии зачастую являются более 
эффективными, чем полные стратегии. Действительно, неполные 
стратегии могут не получить доказательства, даже если оно 
существует, но зато, когда получают, они срабатывают быстрее. 

Кроме того, неполная в общем случае стратегия может оказаться 
полной, если мы ограничим исходный класс предложений. 

Рассмотрим три примера. 

1. Единичная резолюция (поиск от данных). 

Это стратегия, в которой одно из резольвируемых предложений 
является положительным литералом (фактом). 

2. Отрицательная резолюция (поиск от цели). 

Это стратегия, в которой одно из резольвируемых предложений 
является отрицательным литералом (целью). 

3. Входная резолюция. 

Это стратегия, в которой одно из резольвируемых предложений 
выбирается из входных, т.е. заданных первоначально предложений. 

В общем случае все указанные стратегии неполны. В частности, 
входная старегия, которая является частным случаем полной 
линейной стратегии, сама не является полной. 

Пример, демонстрирующий неполноту входной стратегии: 

ПРУО 

2) Рм~ О 
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4) РУО 

5)Р (1,2) 
6) о (5:9) 
7)-Р (6,4) 
8) 0 (7, 5) 


Обратим внимание на то, что вывод построен, но он не является 
выводом по входной стратегии — дизъюнкт Р не является входным. 
Легко видеть, что для множества предложений 1—4 нет опровержения 
по входной стратегии. 


4.2.3. Хорновские предложения 


Существует подкласс предложений, который очень важен с 
точки зрения практического применения метода резолюций. Давайте 
попробуем синтаксически описать общие свойства следующих 
предложений: 

А Факты 

А! &...&Ак-> В Правила 

В Цели 

После перевода в форму предложений эти формулы имеют 
такой вид: 

А 

ЈА... —АммВ 

—В 

Хорн в свое время заметил, что три эти формулы в форме 
предложений обладают следующей синтаксической характеристикой: 
в них содержится не более одного положительного литерала. Выше 
приведены все три возможных случая: один положительный литерал 
(факт), один положительный литерал и несколько отрицательных 
(правило), нет положительных литералов (одни отрицательные — 
цель). 
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Предложения, содержащие не более одного положительного 
литерала, называются хорновскими. 

Кроме этого, множество таких предложений (хорновских 
формул) замкнуто относительно правила резолюции. Если мы 
резольвируем хорновские предложения, мы снова получаем 
хорновское предложение, потому что мы вычеркиваем один 
положительный и один отрицательный литерал, в сумме в 
резольвенете оказывается не более одного положительного литерала. 

Подход для применения метода резолюций в программировании 
был разработан не Хорном, это было сделано позднее Робертом 
Ковальским. Оказалось, что метод поиска от целей и метод поиска от 
данных, которые не являются полными в общем случае, полны в 
хорновском случае. Если существует какой-либо вывод, то 
существует вывод от целей для хорновского случая. 

На основе хорновского случая был разработан язык Пролог, 
который иногда называют логическим программированием. Однако 
понятия Пролога и логического программирования не следует 
отождествлять. Язык Пролог — это частный случай логического 
программирования, а именно, это реализация метода резолюций для 
хорновского случая со стратегией «поиск от целей». Можно 
использовать другие подходы: либо применить другую стратегию, 
либо взять другой подкласс формул, либо вообще рассматривать 
исчисление не первого порядка, — и все это будет логическое 
программирование, но не будет являться Прологом. 


4.2.4. Замечания по реализации 


Разработать прямолинейную систему логического 
программирования или систему автоматического доказательства 
теорем достаточно легко. Однако все такие наивные реализации 
оказываются практически бесполезными. Это происходит из-за того, 
что не учитывается несколько важных факторов: 

1. Важен не выбор стратегии резольвирования, важно качество 
процедуры унификации. Процедура унификации проверяет, 
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унифицируемы ли два литерала, и если они унифицируемы, выдает 
подстановку, которая их унифицирует. Более 90% машинных 
ресурсов системы логического программирования уходит на 
унификацию. Приведенная в разделе 0 процедура унификации совсем 
не эффективна. 

2. Большинство программистов пытается написать программу 
унификации, которая как можно скорее выдает ответ — набор 
подстановок. А в данном случае (для унификации) требуется создать 
программу, которая как можно скорее не получала бы ответ, потому 
что большинство литералов не унифицируемы. Нужно как можно 
скорее выдать Ёа, оборвать выполнение процедуры, не нужно 
вычислять ответ. Его, скорее всего, вычислять не придется. Это 
требует тонких программистских хитростей. 

3. Большинство операций и отношений, которые встречаются в 
реальных задачах, обладают специальными свойствами: 
коммутативностью, транзитивностью и т.д. Если их не использовать, 
то окажется, что не унифицируемо то, что на самом деле, по 
существу, унифицируемо. А если их использовать на логическом 
уровне, то количество аксиом увеличивается в несколько раз. 
Конечно, учет таких вещей, как транзитивность и коммутативность, 
нужно делать на уровне унификации термов, а не на уровне 
логических аксиом. 


4.3. ИЗВЛЕЧЕНИЕ РЕЗУЛЬТАТА 


Метод резолюций строит доказательство теоремы. С помощью 
специальных приемов из доказательства можно извлекать ответы 
(знания) любого типа. Специальные приемы нужны по следующей 
причине. Метод резолюций работает только с предложениями, но 
пользователь ставит реальную задачу не в форме предложений, а в 
той форме, в которой ему удобно. Перед применением метода 
резолюций приходится преобразовывать задачу в форму 
предложений. Выдавать в качестве ответа голое доказательство не 
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очень лояльно по отношению к пользователю Нужно извлечь из 
доказательства то, что ожидает пользователь в качестве ответа. 


4.3.1. Извлечение результата (да/нет) 


Стратегии метода резолюции, которые мы рассмотрели, пока 
давали ответ на вопрос — выводимо или не выводимо решение, то 
есть получался бинарный ответ на вопрос — да или нет. 

Пример. 

Рассмотрим следующие утверждения. 

1) Все студенты группы 5057 знают метод резолюций. 

Власенко” студент группы 5057. 

Знает ли Власенко метод резолюций? 

При переводе в форму предложений и резольвировании 
получаем следующий вывод: 


1) ~ 50570) ~“ Р(х) 

2) 5057(Власенко) 

3) —Р(Власенко) }! 

4) Р(Власенко)} (1,2) 
5) 0 (3, 4) 


Ответ — да, поскольку мы получили пустое предложение. 
2) Все студенты группы 5057 знают метод резолюций. 
Халепский не знает метод резолюций. 

Является ли Халепский студентом группы 5057? 

1) ~ 50570) ~“ Р(х) 

2) — Р(Халепский) 

3) ~ 5057(Халепский) 

4) — 5057(Халепский) (1, 2) — совпадает с 3 


” Власенко, Халепский и Королев — фамилии реальных студентов, 
которые были среди первых слушателей учебного курса, положенного в 
основу этой книги. Их присутствие (или отсутствие) в аудитории оказало 
заметное влияние на подбор примеров и стиль аргументации, и в знак 
признательности мы решились оставить в тексте реальные фамилии. 


216 


Ответ — нет, поскольку нет резольвируемых предложений и нет 
пустого предложения. 

Это и есть извлечение результата. С помощью выбранной 
стратегии мы смогли получить ответ на поставленный вопрос. 

Может показаться, что ответ «да-нет» — это маргинальный 
случай, рассматриваемый только в учебных целях. На самом деле это 
далеко не так. Вот несколько примеров, экспертных систем, которые 
выдают ответ простой «да-нет», являясь при этом и вполне 
реальными и весьма сложными. 

1) Мониторинг окружающей среды. Получены такие-то данные 
наблюдений. Имеется ли угроза, которая требует эвакуации 
населения? 

2) Система противоракетной обороны. Засечен движущейся 
объект. Является ли этот объект вражеской ракетой? 

3) Геологоразведочная система. Собраны косвенные данные о 
некотором районе. Имеются ли в этом районе нефтеносные пласты? 


4.3.2. Извлечение результатов (факты) 


А теперь попробуем поставить вопрос так, чтобы получить 
ответ не форме да-нет, а в форме факта. Для этого нужно 
модифицировать метод резолюций введением специального 
предиката — традиционно называемого предикатом АМ$”. Предикат 
АМ№5 — это предикат, в котором накапливается значение ответа. 
Считается, что этот предикат эквивалентен пустому предложению. 
Если есть предложение, содержащее только предикаты АМ, то это 
пустое предложение. 

Пример: 

Все студенты группы 5057 знают метод резолюций. 

Власенко студент группы 5057. 

Королев студент группы 5057. 

Кто знает метод резолюций? 


72 т 
От английского Апз\ег — ответ. 
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Теперь целевое предложение Р(х) выглядит так: если Р(х), то 
АМ$(х), то есть если х знает метод резолюций, то х является ответом. 
В формальной записи в форме предложений вопрос имеет вид 
Р(х) у АМЅ(х). Напоминаем, что с точки зрения управления выводом 
АМ№ = О. 

Мы проводим резолютивный вывод и получаем 6 предложений, 
последнее из которых АМ5(Власенко), то есть получаем ответ: 

1) ~ 5057(х) ~“ Р(х) 

2) 5057(Власенко) 

3) 5057(Королев) 

4) — Р(х) х АМ(х) 

5) ~ 5057(х) м АМ№ъ№(х) (1, 4) 

6) АМ5(Власенко) (5, 2) 

Можно остановиться, а можно продолжать построение новых 
резолютивных выводов, как и делают системы логического 
программирования, основанные на языке Пролог. Тогда получатся все 
ответы, которые можно получить из условий задачи. 

7) АМ5(Королев) (5, 3) 


4.3.3. Извлечение результатов (термы) 


Используя технику предикатов АМ, можно получать не только 
факты, но и результаты процедурного уровня. Основываясь на этом, 
можно синтезировать выражение (терм), вычисляющее некоторую 
функцию. 

Пример: 

Имеется отношение отец и дед. Аксиомы, описывающие эту 
ситуацию, заключаются в следующем: у любого человека есть отец, и 
отец отца — это дед. 

О(х, у) =х отец у 

Р(х, у) = х деду 

Ух, у, < О(х, у) & О(у, 2) > ОС, 2) 

Уу3Эх О(х, у). 
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Дальше ставим вопрос — кто является дедом х? 

? (у, х) >АМ(у) 

В результате применения метода резолюций получается вывод: 

1) —О(х, у)УО(у, 2)р(х, 2) 

2) О(КУ), у) 

3) —ОС,, х)АМ№(у) 

4) Обу, 2)УБ(КУ), 2) (1, 2, у)/х) 

5) О(ДЈО)), у) (4, 2, ДУ)/у, у//2) 

6) АМЗ(АК»))) (3, 5) 

где /— это функция вычисления отца, которая была получена 
при сколемизации (элиминации существования) второй аксиомы 
этого примера. 

Получен ответ — дедом х является ККх)). 

Таким образом, метод резолюций с точки зрения представления 
знаний является вполне адекватным средством. Он позволяет 
получать содержательные ответы на содержательные вопросы. 


4.4. СИСТЕМЫ ДЕДУКЦИИ НА ОСНОВЕ ПРАВИЛ 


В данном разделе мы попробуем на конкретном примере 
рассмотреть совместно различные способы представления знаний, 
которые мы разобрали в предыдущих главах, то есть представления 
знаний на основе системы продукции и представления знаний на 
основе исчисления предикатов первого порядка. На самом деле между 
ними нет никакой непреодолимой границы. Это все сводимые друг к 
другу вариации на одну и ту же тему, что дает повод считать, что 
действительно есть предмет «представление знаний». Если бы это 
были абсолютно разрозненные вещи, то было бы совершенно 
непонятно, почему они объединяются в рамках одного курса. Мы 
сейчас легко убедимся, что они совсем не разрозненные”. 


73 а. 

При этом за рамками данной книги остается аналогичная ситуация, 
которая имеет место и в других случаях — например, если мы используем 
семантические сети или фреймы. 
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Сначала мы разберем, что же мотивирует нас объединить 
разные системы представления знаний. Затем еще раз с других 
позиций рассмотрим форму И/ИЛИ, которая уже дважды встречалась 
в данном учебнике под разными названиями: первое название было 
«разложимые системы продукции», а второе — «поиск на игровых 
деревьях». Мы еще раз рассмотрим этот аспект представления знаний 
и на трех примерах попытаемся показать, что во всем этом есть общее 
содержание и глубокие внутренние взаимосвязи между приемами и 
техниками, которые здесь используются. В конце этой главы 
продемонстрированы три варианта конкретной техники, которая 
называется «система дедукции на основе правил». 


4.4.1. Потеря импликативности 


Разберем недостатки, присущие методу резолюций. У этого 
метода есть две существенные имманентно присущие ему 
особенности, которые могут рассматриваться в некоторых случаях 
как недостатки. 

Первая особенность состоит в том, что метод резолюции 
работает с приложениями — с бескванторными дизъюнкциями 
литералов. В этих дизъюнкциях нет направления. На самом деле то, в 
каком порядке буквы находятся в предложении, очень важно, потому 
что все алгоритмы линейно просматривают информацию и 
анализируют ее в том порядке, в котором буквы попадаются в 
формулах. Этот порядок может быть важен. 

Если сравнить метод резолюций с привычным методом 
доказательства на основе правила то4из$ ропепѕ, то в самом этом 
правиле заложено явное направление рассуждений. Правило тойиѕ 
ропепѕ выглядит следующим образом: 

А, А В 
В 

Понятно, что в этом случае нужно начинать с 4А, и тогда мы 
придем к В. Есть явное направление рассуждений, заданное самой 
стрелкой. Но когда мы элиминируем стрелки импликаций при 
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сведении формул к предложениям, это направление может быть 


потеряно. 
Пример. 
(«А л В) >С Ау Вес 
(Вл —С) Э А Ау ВУ С 


Выше приведены два совершенно разных импликативных 
правила, которые отражали разную семантику, а после 
преобразования к предложениям эта разница исчезла. Метод 
резолюции не знает, с чего нужно начинать и куда нужно двигаться. 
У него все буквы одинаковы, он их просто механически перебирает, 
пытаясь вывести пустое предложение, но в какую сторону надо 
двигаться, чтобы вывести пустое предложение — этой информации 
нет, она утрачена, хотя, возможно, присутствовала в исходной 
постановке задачи. 

Постановки задачи для системы автоматического 
доказательства — это дело эксперта, который наполняет базу знаний. 
Он-то знает, в какую сторону нужно использовать импликацию, и мог 
бы подсказать системе. Например, эксперт может знать, что вместо 
прямого правила —А —> В следует использовать контрапозитивную 
форму —В А. Но при сведении к предложениям подсказки 
забываются. Метод резолюций видит только формулу А ~“ В. Это 
первый недостаток метода резолюций. Называется это свойство — 


потеря импликативности. 
4.4.3. Размножение литералов 


Второй недостаток данного метода заключается в следующем. 
При преобразовании в предложения мы используем конъюнктивную 
форму, и при этом формула может расширяться, то есть общее 
количество вхождений предикатов в формулы может увеличиваться. 
Другими словами, может произойти так называемое размножение 
литералов. В методе резолюций может оказаться (и в худшем случае 
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оказывается), что коэффициент расширения, который здесь 
наблюдается, носит экспоненциальный характер. 

Пример: 

Власенко отлично учится в группе 5057. 

Все, кто учится в данной группе, являются студентами, все 
студенты знают метод резолюций. 

Отличники умные. 

Попробуем показать следующий факт: существует студент, 
который знает метод резолюций и является либо программистом, 
либо умником. 

Введем соответствующие предикаты и запишем формулы. 

0) .3х Р(х) л (ПО) у У(х)) цель 


1) .5057(Власенко) факт 
2) .О(Власенко) факт 
3) Ух 50570) > С@® правило 
4) Ух С(х) —> Р(х) правило 
5) Ух О(х) > У правило 


Преобразуем формулы в предложения. По правилу метода 
резолюций к цели спереди надо приписать отрицание. При этом 
приписывании первое утверждение разделяется на два, и предикат Р, 
который в исходной постановке присутствовал один раз, после 
преобразования появляется два раза. А теперь начинаем 
резольвирование. 

1) Р(х) у —По 

2) —Р(х) м —У(х) 

3) С(х) у Р(х) 

4) —5057(х)м С(х) 

5) 5057(Власенко) 

6) —(х)О м У(х) 

7) О(Власенко) 

8) = П(х) м —С@) (1, 3) 

9) —П(х) м 5057(х) (8, 4) 
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10) П(х) (9, 5) 


11) ~У() м =С(ә) (2, 3) 

12) —У(х) м —5057(х) (11, 4) 
13) —У(Власенко) (12, 5) 
14) —О(Власенко) (13, 6) 
15) О (14, 7) 


Пункты 8, 9 и 10 — это результативные выводы, резольвенты, 
полученные самым простым образом. Берем два первых подходящих 
предложения и начинаем резольвировать, 8, 9 и 10 пункты в этом 
примере — это первые подходящие, и легко сообразить, что 
полученное —П(х) нам совсем не нужно. Этот результат потом негде 
будет использовать. Программисты вообще в исходных данных не 
упоминались. Это бессмысленно потраченная машинное время и 
память на выполнение вывода, который не нужен. Начинать 
следовало сразу с пункта 11 (резольвируя предложения 2 и 3), первое 
предложение не надо было рассматривать. Атомарная формула —Р(х), 
которая появилась в предложении 1, произошла в результате 
размножения литералов и, безусловно, оказалась вредна для решения 
задачи. 

Вывод построен, но по дороге был ложный ход, который вызван 
тем, что произошло размножение литералов, вытекающее из 
преобразования в конъюнктивную нормальную форму. В результате 
количество вхождений литералов в предложения увеличилось, а 
вывод удлинился. В худшем случае такое увеличение может носить 
экспоненциальный характер. 


4.4.3. Естественное направление дедукции 


Посмотрим на ту же задачу с другой стороны. Не будем сводить 
исходные формулы к предложениям, и применять правило 
резолюции, а применим обычное правило то4из$ ропепѕ. Не станем 
использовать доказательство от противного, применим прямую 
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систему дедукции. В результате все получается гораздо лучше, проще 


и быстрее: 

1) 3х Ро) л (По) у У(х)) цель 

2) 5057(Власенко) факт 

3) О(Власенко) факт 

4) Ух 5057(х) > С(х) правило 

5) Ух С(х) > Р(х) правило 

6) Ух О(х) > УХ правило 

7) С(Власенко) Моди$ ропепз 1, 3 
8) Р(Власенко) Моацѕ ропепз 6, 4 
9) У(Власенко) Моацѕ ропепз 2, 5 


10) П(Власенко) у У(Власенко) правило +, 8 

11) Р(Власенко) л (П(Власенко) у У(Власенко)) правило &+,7,9 

12) Эх Р(х) л (П(х) у У(х)) правило 3+, 10 

Предложения 1 и 3 по Моацѕ ропепѕ дают С (Власенко), 6 и 4 
дают Р (Власенко), 2 и 5 дают У(Власенко), и, применяя правила, 
аналога которым в методе резолюций нет, но которые, очевидно, 
состоятельны, получаем цель. Мы видим, что прямая система 
(обычное рассуждение, а не метод доказательства от противного) — 
простое рассуждение по правилу Мо4и$ ропепѕ, и введение 
дополнительных связок гораздо быстрее, чем в первом случае, 
позволяет получить тот же самый ответ. 

Вот в этом и состоит основная идея. Мы хотим сохранить 
преимущества, которые нам дает представление знаний с помощью 
предложений, и избавиться от недостатков, которое дает это 
представление. Мы хотим избавиться от размножения литералов и 
сохранить направление импликации, чтобы иметь возможность 
проводить такие эффективные и короткие выводы, как во втором 
случае, по сравнению с неэффективными и длинными выводами в 
первом случае. 
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4.4.4. Форма И/ИЛИ 


Попробуем преобразовать исходные формулы, с помощью 
которых записано наше знание о предметной области (формулы 
исчисления первого порядка,) не в форму предложений, а в так 
называемую форму И/ИЛИ, просто проводя меньшее количество 
шагов преобразования. Так же, как при сведении к предложениям в 
методе резолюций элиминируем импликацию, протаскиваем 
отрицание, элиминируем квантор существования, строим 
предваренную форму, убираем квантор всеобщности и разделяем 
переменные в главных конъюнктах (см. параграф 0). 

Если вы обратили внимание, пропущен этап построения 
конъюнктивной формы. Какая форма была, такая форма и осталась, 
мы только избавились от кванторов и разделили переменные. Легко 
видеть, что в результате элиминации импликации, протаскивания 
отрицания, элиминации квантора существования, построения 
предваренной формы, элиминации всеобщности и переименования 
переменных, количество литералов сохраняется. 

Заметим, что форма И/ИЛИ может быть получена по любой 
формуле исчисления предикатов. 

Пример: 

Дана формула (Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..49): 

Зи Уу (О(у, и) л — ((А(у) м Р(у)) л (и, у)). 

Для использования формы И/ИЛИ предлагается представить 
формулу в виде гиперграфа следующим образом. Там, где главная 
операция л, ставится две раздельных 1-дуги, там, где главная 
операция у, ставится одна 2-дуга. Ход рассуждения достаточно прост. 
Когда известно, что А л В, можно повести рассуждение в одну 
сторону, используя то, что дано А, а можно в другую, используя то, 
что дано В. Когда дано АУ В, мы не знаем, в какую сторону 
конкретно двигаться, нужно двигаться сразу в обе стороны. 
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Зи\Уу(О (у, и) ^ —(К(>)у Р(у)) л 5(м,у)) 


Обу, А) ^ (А) ^Р())У—5(А,у)) 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..49. Представления формы И/ИЛИ в виде гиперграфа 

Очевидно, что множество предложений, в которые 
преобразуется корневая формула, может быть прочитано, как 
множество концевых вершин всех графов решения, которые есть на 
этом гиперграфе (Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..49). На этом гиперграфе есть три графа решения. Один 
идет из корня в О, второй идет из корня на следующий уровень и 
дальше обязательно завязывается на 5, потому что там 2-дуга. Нас 
интересуют концевые вершины. Если исходную форму свести к 
предложениям, то их получится три: О, К М —5, ЈР м —ъ. 

Заметим это обстоятельство, форма И/ИЛИ хранит ту же 
информацию, которой мы располагали в методе резолюций, а также 
еще и другую информацию. 

Рассмотрим следующий способ построения машины 
доказательства — ядра интеллектуальной системы логического 
вывода в форме системы дедукции на основе правил. 


4.4.5. Прямая система дедукции 


Так же, как это принято в логическом программировании, мы 
должны разделить все множество формул, всю информацию, которая 


226 


у нас есть в данной предметной области на три класса: факты, 
правила и цели. 

При этом накладываются следующие синтаксические 
ограничения: 

- то, что мы будем считать фактами, на самом деле ничем не 
ограничено и может быть представлено в любой форме И/ИЛИ; 

-то, что мы будем считать правилами, обязательно должно 
иметь вид [—И, где Г, — литерал, а № — любая формула, которая 
будет представлена в форме И/ИЛИ; 

- цель должна быть дизъюнкцией литералов, то есть должна 
быть предложением. Другими словами, можно сформулировать 
условие остановки: целевая формула является предложением, граф 
решения заканчивается в целевых литералах. 

Смысл процедуры наращивания графа И/ИЛИ с помощью 
правил прост. Возьмем факт (или множество фактов) и представим их 
в форме И/ИЛИ. Получится гиперграф. Начнем к листовым узлам 
этого графа прицеплять правила. Каждый листовой узел построенного 
графа унифицируется с левой частью правила. Если унификация 
успешна, мы наращиваем граф (или дерево) И/ИЛИ правой частью 
правила, пока в этом графе не появится граф решения, листья 
которого попадают в целевые узлы (то есть унифицируются с 
целевыми литералами). Когда происходит отождествление левой 
части правила с листовым узлом в графе, возможно, потребуется 
выполнение некоторых подстановок для унификации. Понятно, что 
если в разных графах решения применяются разные правила, то они 
применяются независимо. Но в одном графе решения невозможно 
одновременно подставить вместо одной и той же переменной разные 
термы. Значит, такие случаи должны быть исключены. Фактически, 
механизм, который сейчас описывается, является частным случаем 
метода резолюций, который проводится с помощью перестроения 
графа. 

Рассмотрим это на примере. 
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Факт: Власенко умный и знает метод резолюций или он не 


студент: 
—С(В)\(Р(В)^У(В)). 
Правило 1: Все учащиеся группы 5057 являются студентами: 
-С(х) = —5057(х). 
Правило 2: Тот, кто знает метод резолюций, является 
отличником: 
Ро) >00). 


Цель: Существует некто, кто или не учится в группе 5057 или 
является отличником: 

35 —5057(<) и О(<). 

На примере правила | видно преимущество прямой системы на 
основе правил. Конструктор системы представления знаний для 
конкретной предметной области это правило — «все учащиеся группы 
5057 являются студентами» — может записать сразу в 
контрапозитивном виде: «если он не студент, то он не учится в группе 
5057». Тем самым конструктор системы представления знаний 
(человек) дает подсказку программе логического вывода: в 
дедуктивных системах рассуждать выгоднее от общего к частному, а 
не от частного к общему. Именно это и сделано в правиле 1. Вот 
почему сохранение импликативности так важно и полезно. 

Мы строим прямое дедуктивное рассуждение, а не используем 
метод доказательства от противного. В отличие от метода резолюций, 
отрицание к цели применять не следует. Цель должна использоваться 
в том виде, в котором находится в формулировке задачи. В данном 
случае видно, что после сколемизации цель будет бескванторной 
дизъюнкцией литералов, что и требуется в синтаксическом условии 
прямой системы дедукции. 

Ход рассуждения таков (Рис. Ошибка! Текст указанного стиля в 
документе отсутствует..50). 
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—С(В)у(Р(В)^У(ВУ 


—С (х) Р(В) 


Правило 1 В/у 
—5057(В) Р(у) 
Правило 
В 0) В/ 
50570) О(В) “ Оа) 


Рис Ошибка! Текст указанного стиля в документе 


отсутствует..50. Расширение формы И/ИЛИ применением правил 

В начальный момент граф фактов имеет следующий список 
листовых узлов: —С(В), Р(В) и У(В). Используем наше правило 1 для 
наращивания дерева. Левая часть правила унифицируется с 
подстановкой «В» вместо х. Дерево наращивается правой частью, 
которая унифицируется с первым целевым литералом. Это еще не 
решение, поскольку мы не построили граф решения, который 
заканчивается целевыми  литералами. Поэтому продолжаем 
применять правила. Срабатывает правило 2, и результат 
отождествляется со вторым целевым литералом. 

Построен граф решения, который заканчивается целевыми 
литералами (на рисунке обведен). Чтобы сохранить информацию о 
подстановках, мы вводим дуги соответствия (на рисунке они 
изображены толстыми незакрашенными стрелками), соединяющие 
заменяемые литералы и левые части правил. 

Рассмотрим еще один пример. 
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Дан факт: Р(х)мО(х) 


Правило 1: Р(А)ЭК(А) 
Правило 2: О(В)>К(В), где А и В – конкретные константы. 
Цель: ВК(А)уК(В) 


Заметим, что цель не является логическим следствием фактов. 
Этот пример объясняет, в чем значения ограничения, говорящего о 
том, что подстановки на дугах соответствия в одном графе решения 
должны быть согласованы (Рис. Ошибка! Текст указанного стиля в 


документе отсутствует..51). 


Р(х)\О(х) 
Р(х) О(х) 
А/х В/х 
Р(А) О(В) 
В(А) В(В) 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..51. Несогласованные подстановки на дугах соответствия 

Видно, что подстановки не совместимы: нужно одновременно 
подставить А вместо х и В вместо х. В результате подстановки не 
согласованы, граф решения не построен, как и должно быть, потому 
что цель не является логическим следствием фактов и правил. 

Разобранный в предыдущем разделе пример был достаточно 
показательный. Мы провели в технике графов резолютивный вывод, 
но применимость этого приема ограничена тем, что у нас есть 
синтаксические ограничения на вид фактов, синтаксические 
ограничения на вид правил и синтаксические ограничения на вид 
целей. 
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4.4.6. Обратная система дедукции 


Напомним некоторые определения и факты, известные читателю 
из курса дискретной математики. 

Если (х, ..., х,) — булева функция, то булева функция 

Я ан АНИ. =] 

называется двойственной булевой функцией. 

Пользуясь тем фактом, что дизъюнкция и конъюнкция 
двойственны, а отрицание самодвойственно, наряду с методом 
резолюции можно построить двойственный метод резолюции, где 
элементами, подобными предложениям, будут не дизъюнкции 
литералов, а конъюнкции литералов. В двойственном методе 
резолюций сколемизации будет подвергаться не существование, а 
всеобщность, и будет использоваться не конъюнктивная нормальная 
форма, а дизъюнктивная нормальная форма (К-связка для 
конъюнкции, 1-связка для дизъюнкции). Главной операцией будет 
дизъюнкция. В двойственном методе резолюции мы будем приводить 
отрицание целевой формулы вместе с исходными к тождественно 
истинной формуле, которая тоже будет иметь пустую форму, потому 
что пустая конъюнкция является тождественно истинной. 

Очевидные технические детали этих формальных логических 
построений мы опускаем, потому что нашей целью в этом разделе 
является не работа с логическими формулами, а работа с графами 
И/ИЛИ. 

Теперь мы можем построить также синтаксически 
ограниченную, но уже с другой стороны, систему дедукции на основе 
правил. Можно идти от фактов к цели, а можно, и иногда это удобнее, 
идти от целей обратно к фактам по обратным правилам. В результате 
мы видим, что теперь у нас не ограничена форма целей — это любая 
форма И/ИЛИ. У нас ограничена форма правил, но совершенно 
другим образом. В правилах теперь правая часть должна быть 
литеральной, а левая может быть сколь угодно сложной. Кроме этого, 
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ограничена форма фактов. Это должна быть, конечно, конъюнкция 
литералов, а не дизъюнкция, как в случае прямой системы. 

Условие остановки то же самое: факт является конъюнкцией 
литералов, согласованный граф решения заканчивается в фактах. Мы 
можем наращивать исходную цель, представленную в форме И/ИЛИ, 
с помощью обратных правил, до тех пор, пока она не обопрется на 
факты. 

Рассмотрим пример: построим обратную систему дедукции на 
основе правил, которая будет решать неравенства. 


ПІ: х>0&у>0 —> ху>0 
П2: х>0&у>< > х+у> 2 
ПЗ: х>и&у>& ә х+у>и+; 
14: х> 0 & у>: > ху> х: 
П5: 1>и&х>0 ә х>ж 
Пб: х> (ис+ух) > х> (У); 
ПШ: х>иу&у>0 ә ^лу>и 


Имеется семь правил. В каждом из них в правой части стоит 
один литерал, поскольку вообще в задаче рассматривается только 
один предикат. Слева может быть один предикат или конъюнкция 
предикатов. Таким образом, эти правила по своей синтаксической 
форме подходят для применения в обратной системе дедукции. 

Имеется конъюнкция фактов, заключающаяся в следующем. 

Факты: А, В, СО>0 С>О) 

Целью является такое неочевидное утверждение. 

Цель: В(А+С) > В 

Ход рассуждений представлен на Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..52. 
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В(А+СУО>В 


Б/у, 
В/у 
В(А+О)/ А 
хур ит 
Еа П 7 ИСЕ 
В(А+С)>вр 2>0 
В/ 52 И 
А+С/ у 
П! 
ш х2/ у2 > 22 р>0 
Ла 
В>0 А А+С>0 с А/ Ув 
с 5 Ба ж 
Р/ 25 аа 
В>0 19270525778 х6+ убх 26 
Ра Пэ РЯ г П Васл 
А>0 С>р С>0 А>р 
А>0 С>р С>0 


Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..52. Решение неравенства с помощью обратной системы 
дедукции 

Давайте посмотрим на первое неравенство. Здесь главная 
операция — деление. При унификации, очевидно, сработает правило 
7, других правил с делением в правой части нет. Это первое 
подходящее правило. Правило 7 имеет вид 

х> му& у> 0 > ху> у, 

где х отождествится с В(А+С), при этом у отождествится с р; м 
отождествится с В. Подставляем правую часть правила. Получаем две 
новых цели: О > 0 (это дано) и В(А+С) > ВР. Здесь будет применено 
четвертое правило, в котором есть умножение в правой части. 
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Появляются два подцели: В > О и А+С > р. Ко второй части 
применимы два правила — третье и второе. При этом третье правило 
сводится ко второму, если у = 0, ау нас всего три переменных в 
подцели А+С > Р, значит, применение любого из этих правил будет 
равносильным. Проблема состоит в другом — мы по-разному можем 
провести унификацию ввиду свойства коммутативности. Первая 
подстановка ведет к результату, а вторая заводит в тупик, и с этим 
ничего не сделать. Проверяем, что все подстановки согласованы, 
значит построен граф решения. Обратите внимание, что мы 
использовали каждый экземпляр правил со своими личными 
переменными, чтобы случайно не оказалось одинаковых переменных 
под разными кванторами. 


4.4.7. Комбинация прямой и обратной систем 


Мы рассмотрели один ограниченный случай (прямая система) и 
другой ограниченный случай (обратная система). Возникает 
естественная идея: объединить эти два ограниченных случая в 
надежде получить неограниченный. 

В результате объединения прямой и обратной систем дедукции 
на основе правил получается следующее: имеются факты, 
представленные в форме И/ИЛИ, имеются цели, представленные в 
форме И/ИЛИ, и имеются два сорта правил: прямые правила в форме 
[—>\, обратные правила в форме \->Г. Они будут навстречу друг 
другу наращивать графы решения, пока эти графы не столкнутся. 
Другими словами, мы вводим три вида резолюции: 

1. Резолюция фактов и прямых правил, являющаяся частным 
случаем метода резолюций Робинсона, которую мы уже обсудили; 

2. Резолюция целей и обратных правил, которая является 
частным случаем двойственного метода резолюций; 

3. Резолюция фактов и целей. 

Последняя называется правилом гашения. 
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Правило гашения заключается в следующем: две вершины 
гасят друг друга, если они либо унифицируются, либо гасятся 
исходящие из них К-связки. 

Условие окончания выглядит в этом случае так: корень фактов 
гасит корень целей, и подстановки на дугах соответствия 
согласованы. 

Рассмотрим позитивный пример, чтобы понять преимущества 
комбинированной прямой и обратной системы (это пример уже 


рассматривался в разд. 0): 


Факт: существуют умные студенты 
Обратное правило: программисты знают метод резолюций 
Прямое правило: студенты не знают метода резолюций 
Цель: существуют умные не программисты 


Мы сами решаем, какое правило прямое, а какое правило 
обратное. Это накладывает дополнительную ответственность на того 
эксперта, который заносит эту информацию в базу знаний, но с 
другой стороны позволяет то, что не позволяет метод резолюций: 
сохранить импликативность, показать, в какую сторону надо 
применять рассуждение. 

В результате решение находится достаточно легко (Рис. 
Ошибка! Текст указанного стиля в документе отсутствует..53). На 
этом рисунке гашение обозначено более жирными стрелками. 
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Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..53. Комбинация прямой и обратной систем дедукции. 

Одно применение правила для наращивания фактов, одно 
применение обратного правила для наращивания целей — и сразу же 
гашение. Другими словами, в отличие от метода резолюций, эта 
система сработает за три шага, выполняя всего три унификации. При 
этом ей не надо думать, какие правила применять, не потребовалось 
никакой стратегии. Все применимые правила были применены, и в 
результате получено решение. 

К сожалению, в этом достаточно эффектном примере есть 
сложность. Правило резолюции состоятельно и полно, и правило 
применения прямых правил как частный случай правила резолюции 
состоятельно и полно, и правило применения обратных правил как 
частный случай двойственного метода резолюции состоятельно и 
полно. Однако с правилом гашения все обстоит не так просто и 
хорошо. Оно не универсально, т.е. оно состоятельно, но не полно. 
Существуют такие выводы, которые не могут быть получены по 
правилу гашения (Рис. Ошибка! Текст указанного стиля в документе 


отсутствует..54). 


236 


А & (Вус) & р 


А252 у рр Ҹ 
А (Ву С) р 


5 


Но 
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Рис Ошибка! Текст указанного стиля в документе 
отсутствует..54. Неполнота правила гашения 

Нижняя формула является логическим следствием верхней 
формулы 

(А & В) (С & О) > А & (ВеО) & Б. 

Более того, очень хорошо вырастают деревья навстречу друг 
другу, очень хочется их погасить — буквы одни и те же в обоих 
случаях. Но этого сделать нельзя, поскольку индуктивное 
определение следующее: либо унифицируемые, либо гасятся их (К- 
связки. А в данном случае К-связки как раз и не гасятся. Это разные 
структуры по количеству дуг: наверху три графа решения, а внизу 
два. 

В данном случае комбинированная система дедукции не 
сработала, и причина состоит в том, что само представление И/ИЛИ 
не носит всеобщего характера. Все же что-то мы теряем, когда общую 
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формулу исчисления предикатов переводим в форму И/ИЛИ. Такого 
замечательного факта, который имеет место в методе резолюций, что 
после сведения к предложениям, объединение исходных посылок и 
отрицание теоремы не выполнимо тогда и только тогда, когда целевая 
теорема следует из посылок, здесь, к сожалению, нет. 

Остается открытым вопрос: можно ли подправить форму И/ИЛИ 
таким образом, чтобы резолюция фактов и целей сделалась 
состоятельной и полной так же, как резолюция фактов и правил и 


резолюция правил и целей. 
4.4.8. Метазнания в системах дедукции 


Системы дедукции на основе правил хорошо подходят для 
представления фактов, правил и целей и дают почти полную свободу 
при решении вопроса, что считать фактами, что правилами, а что 
целями. 

Однако есть управляющие знания (метазнания), очень важные 
для ПСИИ, которые трудно вместить в системы дедукции на основе 
правил. Мы приводим три характерных примера метазнаний. Часть из 
них неявно была применена в примерах ранее. 

1. Учет потенциальной ширины ветвления. 

Допустим, что в системе дедукции есть группа правил 
классификации. Например, 

собака(х) —> животное(х) 

кошка(х) —> животное(х) 

и так далее, таких правил может быть много. Формально, такие 
правила можно применять как в прямом, так и в обратном 
направлении. В каком направлении более целесообразно? Это зависит 
от предметной области, от типа решаемых системой задач. Знанием о 
целесообразном направлении применения правил обладает эксперт, 
который строит систему дедукции. Например, эксперт знает, что 
правила классификации не следует применять как обратные правила. 
Дело в том, что применение таких правил в обратном направлении 
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даст очень большую ширину ветвления при разрастании графа целей. 
Такие правила нужно применять в прямом направлении. 

Если эксперт считает, что правила классификации в данной 
системе дедукции все же нужно применять в обратном направлении, 
то ему следует переписать их в контрапозитивной форме: 

—животное (х) —> —собака (х) 

—животное (х) —> —кошка (х), и так далее. 

2. Порядок применения правил. 

Допустим, что в системе дедукции есть прямые правила вида 

РО! у... у Ор) 
или обратные правила вида 
(О. &... & О) >Р 

Применение таких правил наращивает граф К-дугами. Большое 
значение имеет порядок, в котором далее будут рассматриваться узлы 
О, & ... & О,. Например, в обратной системе дедукции на основе 
правил для решения неравенств (см. параграф 0, Рис. Ошибка! Текст 
указанного стиля в документе отсутствует..52) после применения 
правила 4 первым нужно рассматривать выражение В > 0, а не 
выражение А + С > Р. Дело в том, что это выражение уже имеет 
форму факта. Эксперт понимает, что если нам необходим для 
доказательства какой-то конкретный факт, то возможны два случая: 
либо этот факт дан в условиях задачи, либо нет. Из воздуха факт не 
взять. Если факт дан (как в примере 0), то следует продолжать 
рассматривать другие выражения, в надежде свести их к данным 
фактам. Если же факта нет, он не подтверждается, то нужно 
прекратить рассмотрение других выражений, так как их рассмотрение 
ничего не даст — данная ќ-связка все равно не войдет в граф решения. 

Такого рода информация является метазнаниями, которые 
вносятся в дедуктивные системы с помощью специальных приемов. 
Например, с помощью оценочных функций, как в продукционных 
системах. 

3. Условное применение правил. 


239 


Рассмотрим еще раз пример с решением неравенств (см. 
параграф 0, Рис. Ошибка! Текст указанного стиля в документе 
отсутствует..52). Из соображений транзитивности хотелось бы 
сказать, что факт С > О — лишний. Возникает соблазн вставить 
восьмое правило: х > у & у > = Э х > <. Очень опасное правило! Дело в 
том, что его правая часть применима всегда, и она унифицируема с 
чем угодно в этой системе. Здесь две простые переменные связаны 
единственным предикатом, который есть в системе. Какой бы узел ни 
стоял в графе И/ИЛИ, его всегда можно унифицировать с правой 
частью правила транзитивности. А это означает, что такое правило 
будет использоваться постоянно. Можно сказать, что правило 
транзитивности слишком применимо! Такие правила не стоит 
использовать непосредственно. Их можно спрятать в унификацию 
(так обычно и поступают), либо (очень красивое решение) добавить в 
наш алгоритм метазнание, говорящее о том, что есть правила, 
которые можно применять всегда, когда они применимы, а есть 
правила, которые применяются только при особых условиях. Это 
некие условия о структуре текущей базы знаний, которая управляет 
применением или неприменением правил. Метазнание для 
транзитивности такое: правило транзитивности можно применять 
тогда и только тогда, когда один из конъюнктов в левой части 
является фактом. Если это не так, то в результате применения правила 
транзитивности размножаются цели. Если же это так (если один из 
конъюнктов, стоящих в левой части правила транзитивности, 
сопоставим с фактом), то в результате происходит просто 
передвижение по фактам. При этом дерево решения остается 
линейным. Дерево не будет ветвиться, а будет просто виться по 
цепочке транзитивности, что и требуется от применения правила 
транзитивности. При применении его просто так, порождается у, с 
которым неизвестно что делать. Можно согласиться на порождение 
этого у, только если удается взамен избавиться от х. 
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Вывод из приведенных примеров метазнаний состоит в 
следующем: метазнания — это не знания о предметной области, для 
которой строится система дедукции, это знания о знаниях, о том, как 
применять и использовать знания о предметной области, какими 
свойствами обладают знания о предметной области и т.д. 

Очень хорошие результаты дает двухуровневая система 
дедукции на основе правил. Такая система на верхнем уровне 
содержит метазнания, также представленные, например, в форме 
правил. Фактами в системе верхнего уровня является описание 
текущего состояния системы нижнего уровня. Целью является 
построение (синтез) стратегии управления для системы нижнего 
уровня. На втором уровне находится обычная система дедукции, 
правила, факты и цели которой берутся из предметной области. 
Система верхнего уровня определяет для системы нижнего уровня, в 
каком направлении нужно применять правила, в каком порядке 
рассматривать узлы, при каких условиях можно применять правила и 


Т.Д. 


ВЫВОДЫ ПО ГЛАВЕ 4 


1. Исчисления предикатов первого порядка с внелогическими 
функциями и предикатами достаточно для представления знаний во 
всех разумных случаях 

2. Методы поиска доказательства являются полуразрешающими 
процедурами, эффективность которых зависит от применяемой 
стратегии 

3. Графы И/ИЛИ и подобные структуры можно использовать 
для поиска логического вывода также, как и для систем продукций 
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ЗАКЛЮЧЕНИЕ 


За полвека развития искусственного интеллекта было 
предложено и проверено на практике достаточно много различных 
подходов к представлению и обработке знаний. Среди них 
естественным образом выделяются три группы, три кластера, 
различающиеся используемым базисом — формальным аппаратом, 
явно или неявно используемым при реализации конкретных 
приложений”. Эти три группы суть: 

- системы продукций, основанные на теории графов; 

- логические исчисления, основанные на математической 
логике; 

- другие (например, нейронные и эволюционные системы). 

Именно эти три группы методов положены в основу структуры 
книги. Следует заметить, что все новые, предлагаемые в последнее 
время подходы к представлению знаний, явным образом тяготеют к 
одной из этих групп. В то же время между системами продукций и 
логическим выводом нет непроходимой границы: мы приводим в 
последней главе несколько примеров сведения методов одной группы 
к методам другой группы. С другой стороны, другие методы 
представления знаний, такие как фреймы, семантические сети, 
нейронные сети и им подобные, по своей природе эклектичны и, в 
конечном счете, опираются на разобранный в пособии базовый 
математический аппарат. 

Таким образом, знакомство с идеями представления и обработки 
знаний в рамках выделенных подходов является вполне достаточным 
для того, чтобы быть в курсе основных тенденций искусственного 
интеллекта. 


“ Это не исчерпывающая таксономия и не закон природы. Так 
сложились обстоятельства к настоящему времени, и мы исходим из 
существующего положения вещей. 


242 


БИБЛИОГРАФИЧЕСКИЙ СПИСОК 


1. Вирт Н. Алгоритмы + структуры данных = программы. М.: 
Мир, 1985. 

2. Виноград Т. Программа, понимающая естественный язык. М.: 
Мир, 1976. 

3. В.М Матросов, С.Н. Васильев, В.Г. Каратуев и др. Алгоритмы 
вывода теорем метода векторных функций Ляпунова. Ред. В.М. 
Матросов. Новосибирск: Наука, Сиб. Отделение, 1981. 

4. Лавров С.С. Представление и использование знаний в 
автоматизированных системах // Микропроцессорные средства и 
системы, 1986, №3. 

5.А. Ахо, Дж. Ульман. Теория синтаксического анализа 
перевода и компиляции. (в двух томах). М.: Мир, 1978. 

6. Чень Ч. и Ли Р. Математическая логика и автоматическое 
доказательство теорем. М.: Наука, 1983. 

7. Дал У., Дейкстра Э., Хоар К. Структурное программирование. 
М.: Мир, 1975. 

8. Энциклопедический словарь Брокгауза и Ефрона. Санкт- 
Петербург, 1890—1907. 

9. Фейс Р. Модальная логика. М.: Наука, 1974. 

10. Тейз А., Грибомон П., Ж. Луи и др. Логический подход к 
искусственному интеллекту. т.1. От классической логики к 
логическому программированию. М.: Мир, 1990. 

11. Заде Л. Понятие лингвистической переменной и его 
применение к принятию приближенных решений. М.: Мир, 1976. — 
166с. 

12. Е. Ваадег. Тһе Пезсириоп Гос Нападоок. Ме\м Үогк: 
СатЬпаве Отуегзиу Ргеѕѕ, 2003. 

13. Нильсен Н. Принципы искусственного интеллекта. М.: Радио 
и связь, 1985. 


243 


14. Рау! М., Ритет Н. А сотрийпе ргоседиге ог даапиЙсаноп 
Феоту. Ј. АСМ., 1960, 7, №.3, рр. 201-215. 

15. КоЫпѕор Т.А. Тһеогет ргоуіпе оп ће сотриќег. Ј. АСМ, 1963, 
10, №о.2, рр.163-174. 

16. Маслов С.Ю. Обратный метод установления выводимости в 
классическом исчислении предикатов. // ДАН СССР, 1964. вып.159, 
№1. — с. 17-20. 

17. Касьянов В.Н., Евстигнеев В.А. Графы в программировании: 
обработка, визуализация и применение. СПб., БХВ-Петербург, 2003. 
— 1104 с. 

18. Нам Р. Е., №ПИ$зоп, М. Ј., КарВае1, В. А Ғогта! Ва$1$ Гог ће 
Неиизис Оаегттайоп о Мшипит Соѕі Раз // ТЕЕЕ ТгапзасНоп$ оп 
Ѕуѕѓетпѕ сепсе апа Субегпейсѕ 55С4, 1968. №2. — С. 100 - 107 

19. Мендельсон Э. Введение в математическую логику. М.: 
Наука, 1976. 


244 


Новиков Федор Александрович 


СИТЕМЫ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ 


Лицензия ЛР № 020593 от 07.08.97 


Налоговая льгота — Общероссийский классификатор продукции 
ОК 005-93, т. 2; 95 3005 — учебная литература 


Подписано в печать 20.05.2008. Формат 60х84/16 Печать цифровая 


Усл. печ. л. 8,75. Уч.-изд. л. 8,75. Тираж 130. Заказ 


Отпечатано с готового оригинал-макета, предоставленного автором 
в цифровом типографском центре Издательства Политехнического 
университета: 

195251, Санкт-Петербург, Политехническая ул., 29. 

Тел. (812) 540-40-14 
Тел./факс: (812) 927-57-76 


245 


